@ 2022.04.13 , 20:07

100位作者 智源、清华等机构的合作论文被指部分抄袭

国内AI领域最近出了一件尴尬事。

Google Brain研究员Nicholas Carlini在博客(最下链接)中指出,智源、清华、北航等机构合作完成的研究论文《A Roadmap for Big Model》,抄袭了他们的论文《Deduplicating Training Data Makes Language Models Better》,并且附上了调色盘。

博文节录

我最近开始意识到机器学习研究领域的一个抄袭案例。论文 A Roadmap for Big Model 抄袭了我最近的一篇论文 Deduplicating Training Data Makes Language Models Better 中的几个段落。 (具有讽刺意味的是,Big Models 的论文抄袭了一篇关于数据复制的论文)这很不幸,但令我沮丧的是,我们的论文并不是唯一抄袭的论文: Big Models 的论文至少抄袭了十几篇其他论文。

总体而言,这种特殊形式的复制并不是最糟糕的事情。这不像一篇论文直接复制了先前结果的方法并声称它是自己的。但是,即使将别人的作品视为自己的作品是错误的这一事实不谈,调查论文的价值在于他们如何重新构建该领域。仅直接从先前论文复制的调查论文并没有为该领域贡献任何无法从参考文献列表中获得的新内容。

……

调色盘
100位作者 智源、清华等机构的合作论文被指部分抄袭

因为被指抄袭的论文《A Roadmap for Big Model》一共有100多位共同作者,一半的人都是共同一作,还有1/4的人是共同通讯。如果每个作者都对终稿有所贡献,或许只是其中几位作者偷懒,导致坏了一锅好汤……但论文发出之前,100多位作者竟然没有一个去查重,也确实心大。现在不管是否有抄袭行径,所有作者的名誉一同受损。

2017年,引力波天文学里关于中子星合并的论文,署名的共同作者有3600余位。因为AI领域现在还没有如此庞杂的合作项目,以后随着系统扩张,超署名的论文只会越来越多。或许这次事件有助于建立新的规范吧。

北京智源人工智能研究院已表示将彻查此事,对于学术造假绝不姑息。

https://nicholas.carlini.com/writing/2022/a-case-of-plagarism-in-machine-learning.html

赞一个 (16)