据相关资料显示，一文看懂“华为盘古大模型被指套壳抄袭”风波

经历一天行业热议后，华为AI大模型研究团队如今终于回应盘古开源模型被质疑套壳抄袭争议。

7月5日下午，华为旗下AI大语言模型盘古Pro MoE技术开发团队“诺亚方舟实验室”发布了一份声明，称盘古 Pro MoE开源模型是基于昇 XM外汇代理腾硬件平台开发、训练的基础大模型，并非基于其他厂商模型增量训练而来。

“咱们注意到近期开源社区及网络平台关于盘古大模型开源代码的讨论。盘古 Pro MoE 开源模型是基于昇腾硬件平台开发、训练的基础大模型，并非基于其他厂商模型增量训练而来，在架构设计、技术特性等方面做了关键创新，是全球首个面向昇腾硬件平台设计的同规格混合专家模型，创新性地提出了分组混合专家模型（MoGE）架构，有效处理了大规模分布式训练的负载均衡难题，提升训练效率。其他技术特性创新，请参考昇腾生态竞争力系列技术报告披露数据。”华为盘古团队表示。

简要回顾一下，

盘古Pro MoE技术开发团队强调，团队始终坚持开放创新，尊重第三方知识产权，同时提倡包容、公平、开放、团结和可持续的开源理念。感谢全球开发者与合作伙伴对盘古大模型的关注和适配，团队高度重视开源社区的建设性意见。希望通过盘古大模型开源，与志同道合的伙伴一起，探索并不断优化模型能力，加速技术突破与产业落地。

来自午点新闻官网：

据悉，诺亚方舟实验室是华为公司于2012年设立的人工智能研究机构，聘用全球科研人员从事基础研究。该实验室通过迁移学习等技术创新，为盘古大模型等重大项目供应核心算法适配。目前，诺亚方舟实验室主要负责华为盘古大语言模型（LLM）系列研发工作。

午点新闻财经：

2021年，华为云发布了盘古系列预训练大模型，包括NLP（自然语言）大模型、CV（视觉）大模型、科学计算大模型。

说出来你可能不信，

今年6月21日，华为云发布盘古大模型5.0，包含不同参数规格的模型，如十亿级参数的Pangu E系列可支撑手机、PC等端侧的智能应用；百亿级参数的Pangu P系列，适用于低时延、低成本的推理场景；以及千亿级参数的Pangu U系列、万亿级参数的Pangu S系列超级大模型等，帮助企业更好地在全场景应用AI技术。

6月30日，华为公司宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术，并对外公布相关研究论文。对此，华为表示，此举是华为践行昇腾生态战略的又一关键举措，推动大模型技术的研究与创新发展，加速推进人工智能在千行百业的应用与价值创造。

但随后，华为盘古Pro MoE模型被质疑套壳抄袭阿里云通义千问Qwen-2.5 14B模型。

很多人不知道，

7月4日，一项发布于GitHub的研究指出，华为盘古Pro MoE 模型（总参数720亿）采用了LLM-Fingerprint（模型指纹技术），与阿里通义千问Qwen-2.5 14B模型的注意力参数分布存在高度相似性，平均相关性达0.927（接近完全一致的1.0），显著超出模型间正常差异范围，并指向“非独立开发”的可能性。

午点新闻播报

其实，

不妨想一想，

截至发稿前，上述GitHub库已经删除。

然而，

对此，华为诺亚方舟实验室在最新声明中否认抄袭指控，并称此为引用开源组件，并进行了合规标注，符合开源协议要求。

请记住，

该事件在过去一天引起广泛关注，社交平台上有很多讨论。知乎上多篇帖文指出，这个GitHub作者将大语言模型的每个transformer层的QKVO参数的标准差组合在一起形成特征向量，作者把这个模型叫做“指纹”，然后作者根据模型指纹计算大语言模型之间的距离，将其作为相似度。但这种逻辑方法不能衡量模型的相似度，而且本身采取参数标准差来判定并非科学手段。

午点新闻认为：

截至发稿前，阿里Qwen方面暂时没有声明回应。但笔者了解到，多个大厂AI研究团队都在关注此事进展。

简要回顾一下，

抄袭事件再次暴露出AI大模型开源定义模糊、协议规则与法律界定部分仍比较“模糊”、开源的模型与代码协议较为混乱等疑问。

这你可能没想到，

普遍而言，开源并不代表没有版权，任何第三方采取都应该遵循其开源许可协议，如果企业需要用开源代码进行商业化，需要与开源项目所有者进行授权或提交一定的费用。而在法律层面上，大模型所 TMGM外汇平台有者允许通过专利、商标、版权等方法保护自己的大模型知识产权。

更重要的是，

多位开源行业专家曾对笔者表示，采取开源项目主要关注两点：一是要声明原作者是谁，诸位用的是哪个项目，而且要遵循开源项目里的开源协议、作者声明，不能修改且不能删除；二是关注项目的商业化界限，有些项目可用于商业化，还有一些项目不允许商业化、二次开发等，这需要开发者重新沟通和评估。

说到底，

在此之前，零一万物开源大模型Yi-34B被质疑采取Meta LIama开源模型架构，斯坦福大学的Llama3-V项目曾套壳面壁智能研发的MiniCPM-Llama3-V 2.5、等事件，均引发开发者群体的关注。

午点新闻认为：

未知资本常务董事william wong曾表示，很多初创公司后台接入ChatGPT，前端做了个UI设计就上架苹果商店鼓吹自己在做生成式AI创业了，他认为这种生成式AI项目没有技术壁垒和商业逻辑，只是“蹭热度”。

午点新闻财经：

但随着今年开源AI模型DeepSeek-R1/V3风靡全球，自研底座大模型技术成本较高，很多AI模型和应用背后都有DeepSeek身影。因此，未来如何定义好开源AI模型边界，让开源技术更加健康有序发展，仍是行业亟待处理的核心课题。

不妨想一想，

据华为云称，过去一年中，盘古大模型已经在30多个行业、400多个场景中落地，在政务、金融、制造、医药研发、煤矿、钢铁、铁路、自动驾驶、工业设计、建筑设计、气象等领域发挥巨大价值。（作者｜林志佳，编辑｜盖虹达）

午点新闻

扫一扫打开手机网站

微信扫一扫关注我们

据相关资料显示，一文看懂“华为盘古大模型被指套壳抄袭”风波

作者: aokcikk

联系我们

微信扫一扫关注我们

给这篇文章的作者打赏

作者: aokcikk

为您推荐

张朝阳对话诺贝尔奖得主：AI被过度炒作

来自午点新闻官网：Perplexity CEO称赞月之暗​面，希​望基于Kimi K2进行后训练

午点新闻快讯：ChatGPT破案，成功揭露500万美元遗产欺诈

必须指出的是，AI​时​代的华人打工皇帝：​年薪2亿美元​

消息称问界M8纯电版汽车本月“可能”开启小定

有分析指出，阿维塔总裁陈卓谈小米雷军跨界造车：对汽车营销形成降维打击，CMO可能将失业

联系我们

微信扫一扫关注我们

来自午点新闻官网：Perplexity CEO称赞月之暗面，希望基于Kimi K2进行后训练

必须指出的是，AI时代的华人打工皇帝：年薪2亿美元