@ 2014.06.04 , 23:01
20

看似很有道理的研究报告,其实可能只是计算机生成的

[-]

学术出版界是个鱼龙混杂的地方,并不是所有人都抱着证明自己或发现真正有价值的东西来的。所以像Springer和电气电子工程师学会(IEEE)这样厉害的出版商早就学会了在出版之前,逐字逐句的读完所有科学报告。两家出版社至今已经将100多篇科学研究报告发回作者,因为这些报告看似牛逼,其实只是用计算机生成,里面什么也没说。

法国格勒诺布尔市的格勒诺布尔第一大学的计算机学家Cyril Labbé对2008年至2013年会议文献资料中的计算机生成论文进行了跟踪研究。在进行跟踪研究之前,Labbé已经试验过了多种方法用于排查计算机程序SCIGen生成的伪论文。SCIGen能够运用完美的工程和科学术语组合出论文,这些论文看似可信度很高,实际上什么都没说。

这样的事情在学术界并不是第一次见到。1986年,一名物理学家撰写了一篇论引力的论文,文章认为至今没有发现任何关于引力属于客观事实的可信观点,他认为引力只是某种后现代理想。这篇论文非常轻易地被发表在哲学期刊《Social Text》上。

Labbé私下里将他发现的120篇伪造论文通知了出版商,收到通知的出版商说他们会立即进行删除。Labbé认为这些伪造论文之所以能够出版,原因是学界审核标准的松懈。据Labbé称,科学家的学术压力之大,是一般人不敢想象的,科学家迫于压力需要大量发表论文,这就导致了许多科学家发表的论文越来越水。

出版过16篇伪造论文的Springer表示将所有伪造论文从网站上删除要花费大量时间,更何况公司每年还会出版2200本图书,发表8400篇期刊文章。讽刺的是,前不久Labbé还通过Springer发表过一篇如何排查伪造论文的文章。

声望斐然的麻省理工学院的计算机工程师们在2005年写出了SCIGen这个程序,为的只是证明,即便是毫无意义的论文,科学期刊也会照单全收。当他们发现一些知名科学期刊接收了他们用计算机生成的论文后还是很吃惊,所以他们相信一些作者会将SCIGen纯粹作为赚钱的工具。

对于自己是否已经排查出所有利用SCIGen生成的伪论文,Labbé无法验证,因为他无法从有限的订阅源下载所有论文。但是120篇这个数字确实已经引起了学术界的广泛关注。IEEE发表了一份声明生成他们已经收到了建议,所有不符合出版公司既定质量要求的研讨会论文全部会被删除。他们也表示他们将尽力确保将来不会出现这种情况。

我用SCIGen(不知道是不是真的)生成了一篇论“如何理解在线算法”的论文

[-]
点击图片可进入网站
本文译自 guardianlv,由译者 王大发财 基于创作共用协议(BY-NC)发布。


给这篇稿打赏,让译者更有动力
支付宝打赏 [x]
您的大名: 打赏金额:

0.0
赞一个 (1)

TOTAL COMMENTS: 20+1

  1. 2428819

    这是我们该写毕业论文的人的福音么

    [47] XX [3] 回复 [0]
  2. Therion
    @3 years ago
    2428821

    OK,看來師妹的畢業論文有著落了

  3. moonlight
    @3 years ago
    2428822

    我的毕设就是一个牛逼的论文生成器~

    [98] XX [2] 回复 [0]
  4. 高玩
    @3 years ago
    2428823

    看到标题就想起王大发财平时转的文章,结果发现这篇还是王大发财转的……

  5. 山药炒黄瓜
    @3 years ago
    2428824

    看似没有错别字的oioi,实际上可能只是纠错软件的功劳。

    [63] XX [1] 回复 [0]
  6. 2428826

    居然看到母校了…

  7. 飞机
    @3 years ago
    2428830

    王大发财 用生成器生成了煎蛋所有的文章 不要问我怎么发现的

    [74] XX [0] 回复 [0]
  8. 2428831

    大四那年最后一个夏天,我就是个牛逼的人肉论文生成器……

    [22] XX [2] 回复 [0]
  9. 2428832

    @moonlight: 我靠~咱俩想法一样儿一样儿的~

  10. redhusa
    @3 years ago
    2428833

    别闹正写毕业设计呢!!什么都实现出来了就是没有揉成倒数第二章呢

  11. 日人民报
    @3 years ago
    2428836

    那么。。有没有别的专业论文生成器的呢?

  12. KC海马濑人
    @3 years ago
    2428840

    实践了一下,发现生成的论文水平太高。真要交了老师一定以为我是抄的

    [60] XX [0] 回复 [0]
  13. 恬家小人物
    @3 years ago
    2428844

    本篇文章是网络软件自动生成,鉴定完毕

  14. mayans
    @3 years ago
    2428851

    实际效果请参考王大发财的碳烤,气烤

  15. 2428868

    小编可能有所不知….online algorithm不是网络算法….是在线算法…这是computer science里面的一个专有名词…

  16. 煎蛋
    @3 years ago
    2429115

    “1986年,一名物理学家撰写了一篇论引力的论文,文章认为至今没有发现任何关于引力属于客观事实的可信观点,他认为引力只是某种后现代理想。这篇论文非常轻易地被发表在物理学期刊《Social Text》上。”

    这一段的翻译和原文可能都有点问题。首先,原文说的是philosophy journal,哲学期刊。Social Text就是《社会文本》,那么原文提到的这件事很可能是著名的索卡尔诈文事件,发生的时间是1996年。http://en.wikipedia.org/wiki/Sokal_Affair

  17. 2429187

    搞科研的,只有5%的人在真正能出成果,其余都是水货,在重新阐述别人的想法,二笔一样。就算在5%里的,4/5都在跟风补充,就是在1%的人出了成果,之后马上随便变化一下用在别的地方或者补充一些细节。
    但是99.99999%的钱都花在那95%的水货身上。

    去看看普林斯顿高研所的办公室就知道1%出成果的人活在怎么样简朴的状态了,但就带着整个人类的思想前进就是那么破破烂烂的办公室里的人做的。

  18. queque
    @3 years ago
    2429193

    我的本科毕设是一个博导模拟器,通过本科阶段观察几个博导指导研究生和博士生的方法模式,编程出来的一个人工智能。主要从SCI的一些期刊里数据挖掘,跨了特定的几个学科,并分配给不同的杂志的影响因子做权重,运用进化算法跨学科碰撞,进化出最有可能突破方向和科研思路,以方法学和形式系统推,拼凑出一份有研究价值的论文提纲latex文件。

  19. 2429286

    生成的文章引用文献里竟然有不存在的自引=。=

  20. yetian
    @3 years ago
    2432046

    额,不知为啥突然发不起了,找个冷新闻测试下…

发表评论


24H最赞