人工智能
AI发现:大前年发表的神经医学论文有17%几率是伪造的
“发表或完蛋”的压力导致一些绝望的研究人员为了美化履历而付费购买假论文。
更糟糕的是,一些这样的假论文被正规科学期刊发表了。
一款检测虚虚假论文的计算机程序表明,太多的假论文逃过了同行评审。
这项研究作为一篇预印本论文发表,仍在等待同行评审,但如果结果得到证实,那就非常令人担忧。
研究人员训练了人工智能,让它寻找常见于提交给科学期刊的假论文中的几个特征。
当这个工具能够以90%的准确率发现造假特征后,它就被用来筛查大约5000篇2020年发表的神经科学和医学论文。
该工具将28%的论文标记为可能是虚构或抄袭的。
如果这适用于2020年发表的130万篇生物医学论文,那么超过30万篇会被标记。
并非所有标记都准确无误,但它们有助于识别最可疑的研究——应该受到评审人员的额外审查。
在新工具识别出的每100篇标记论文中,大约有63篇是假的,37篇是真实的。
德国马格德堡奥托冯格里克大学(Otto-von-Guericke University of Magdeburg)的神经心理学家伯恩哈德·萨贝尔(Bernhard Sabel)是这项研究背后的一位作者,也是一份神经学期刊的编辑。
他和许多其他人一样,一直在应对假论文数量的增加。但即使是萨贝尔也对他的工具的初步数字感到震惊。
他告诉Science说:“这太难以置信了。”
萨贝尔和他的同事指责“论文制造场”(paper mills)是造成欺诈活动的罪魁祸首。造纸厂自称是“学术支持”服务,但实际上,它们使用人工智能来扩大和出售虚假出版物给研究人员。
假论文的价格从1000美元到25000美元不等。
这些研究的质量通常很差,但刚好足以通过同行评审,甚至在知名期刊上发表。
出版商意识到这是一个严重的问题,损害了他们的声誉。科学家甚至欺骗出版商接受可笑的假论文,以引起对这个问题的关注。
有时候,paper mills甚至会花钱让出版商接受他们的假论文。事实上,一封未经请求发送给期刊编辑的电子邮件促使了这项新研究立项。
“由于这个问题仍然被认为很轻微(估计每1万份出版物中有1份),出版商和学术团体才刚刚开始调整编辑、同行评审和出版程序。然而,虚假出版物的实际规模仍然不为人知,尽管关于paper mills的报告数量正在增加。”
在2010年到2020年之间,新工具显示一些期刊发表潜在假论文的比率增加了12个百分点。
潜在假论文数量最多的国家是中国,占被标记数量的一半以上。俄罗斯、土耳其、埃及和印度也是重要贡献者。
“虚假科学出版可能是有史以来最大的科学骗局,浪费财政资源,减缓医学进步,并可能危及患者。”研究人员辩称。
而ChatGPT等生成式人工智能技术只会使这种骗局更具威胁。
为了对抗这种新兴技术,并维护科学本身的声誉,研究人员说迫切需要一个更严格的评审系统。
论文预印本发表在medRxiv上。
https://www.sciencealert.com/up-to-30-of-published-neuroscience-papers-may-be-faked-and-thats-before-chatgpt