@ 2014.06.04 , 23:01

看似很有道理的研究报告,其实可能只是计算机生成的

[-]

学术出版界是个鱼龙混杂的地方,并不是所有人都抱着证明自己或发现真正有价值的东西来的。所以像Springer和电气电子工程师学会(IEEE)这样厉害的出版商早就学会了在出版之前,逐字逐句的读完所有科学报告。两家出版社至今已经将100多篇科学研究报告发回作者,因为这些报告看似牛逼,其实只是用计算机生成,里面什么也没说。

法国格勒诺布尔市的格勒诺布尔第一大学的计算机学家Cyril Labbé对2008年至2013年会议文献资料中的计算机生成论文进行了跟踪研究。在进行跟踪研究之前,Labbé已经试验过了多种方法用于排查计算机程序SCIGen生成的伪论文。SCIGen能够运用完美的工程和科学术语组合出论文,这些论文看似可信度很高,实际上什么都没说。

这样的事情在学术界并不是第一次见到。1986年,一名物理学家撰写了一篇论引力的论文,文章认为至今没有发现任何关于引力属于客观事实的可信观点,他认为引力只是某种后现代理想。这篇论文非常轻易地被发表在哲学期刊《Social Text》上。

Labbé私下里将他发现的120篇伪造论文通知了出版商,收到通知的出版商说他们会立即进行删除。Labbé认为这些伪造论文之所以能够出版,原因是学界审核标准的松懈。据Labbé称,科学家的学术压力之大,是一般人不敢想象的,科学家迫于压力需要大量发表论文,这就导致了许多科学家发表的论文越来越水。

出版过16篇伪造论文的Springer表示将所有伪造论文从网站上删除要花费大量时间,更何况公司每年还会出版2200本图书,发表8400篇期刊文章。讽刺的是,前不久Labbé还通过Springer发表过一篇如何排查伪造论文的文章。

声望斐然的麻省理工学院的计算机工程师们在2005年写出了SCIGen这个程序,为的只是证明,即便是毫无意义的论文,科学期刊也会照单全收。当他们发现一些知名科学期刊接收了他们用计算机生成的论文后还是很吃惊,所以他们相信一些作者会将SCIGen纯粹作为赚钱的工具。

对于自己是否已经排查出所有利用SCIGen生成的伪论文,Labbé无法验证,因为他无法从有限的订阅源下载所有论文。但是120篇这个数字确实已经引起了学术界的广泛关注。IEEE发表了一份声明生成他们已经收到了建议,所有不符合出版公司既定质量要求的研讨会论文全部会被删除。他们也表示他们将尽力确保将来不会出现这种情况。

我用SCIGen(不知道是不是真的)生成了一篇论“如何理解在线算法”的论文

[-]
点击图片可进入网站
本文译自 guardianlv,由 王大发财 编辑发布。

赞一个 (1)