智源社区(智讯社区)

none

来自清华、北大、上海交大；来自腾讯、华为、JD.COM、字节跳动、热门人工智能研发机构北京致远人工智能研究所的数十位国内AI大牛参与了署名论文，谷歌大脑的一位研究员指出论文抄袭严重。

被控论文名为《大模型路线图》(以下简称《大模型》)。根据知远社区在论文发表时发表的文章，该论文“由五道大模型研究项目负责人、知远副校长、清华大学计算机系教授唐杰领衔，从大模型基础资源、大模型构建、大模型关键技术、大模型应用探索四个方面，全面研究了15个具体领域的16个相关课题。

研究员尼古拉斯·卡里尼(Nicholas Carlini)最近在其博客中列出了大量与他早先的论文《重复数据删除训练数据让语言模型变得更好》一模一样的段落。更讽刺的是，后面这篇抄袭论文的研究主题是重复数据删除和重复检查。

而且，他还说，可能还有至少十篇其他论文被抄袭。

查预印本服务器arXiv可以发现，Google Brain研究员的论文是去年7月上传的，而大模型是今年3月上传的。两篇文章讨论的“大模型”是目前国际上人工智能研究领域最热门的话题之一。

这篇巨大的论文有数百名作者签名。论文长达几十页，第一页专门列出参与论文的作者。

其中不乏国内AI行业和学术界的知名大佬，服务机构几乎将国内知名高校和互联网巨头一网打尽。

在论文作者的引言部分，“唐杰设计了这个大模型的路线图”。根据清华的官方信息，唐杰于2006年在清华大学计算机系获得博士学位。他的兴趣包括社交网络分析、数据挖掘、机器学习和知识图谱。2022年1月，唐杰刚因其在信息和社交网络挖掘方面的贡献当选为国际计算机学会院士。在作者栏里，有很多像唐杰这样的中国人工智能行业的名人。

尼古拉斯·卡里尼在博客中说:“很可能只有少数作者参与了这次抄袭，少数作者的不当行为不应该被用来指责大多数行为良好的作者。”

Nicholas Carlini的曝光博客发酵后，arXiv曾在涉及抄袭的“大模型路线图”论文页面下添加了重叠文字的警告。

今天中午，负责《大模型路线图》论文的北京致远人工智能研究院官方账号已对此情况作出回应，称:“我们注意到对《大模型路线图》一文的质疑，正在核实相关情况。致远研究院鼓励学术创新和学术交流，对学术不端行为零容忍。相关进展会第一时间上报。”

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。

作者：美站资讯，如若转载，请注明出处：https://www.meizw.com/n/254439.html