@ 2017.07.31 , 18:30

新闻界已经用上了人工智能:用软件量产数据类文章

新闻界已经用上了人工智能:用软件量产数据类文章

你也许是小联盟棒球的球迷,也可能是个对上季度公司境况感兴趣的投资者,又抑或是一个执着于钻研当地竞选结果的政治瘾君子。但无论是哪类数据老饕,得知其每日过目的新闻故事都并非人类所作定会大跌眼镜。

假以人工智能之手的自动化新闻工作,运用算法将数据生肉(例如体育赛事比分或是公司利润报告)做成大餐,似乎已经成为了媒体行业的一股新热潮。比如运用机器作家能够帮助报社批量生产的以数字为主的主题报道,同时将人类从加班加点炮制程式化文章的苦海中脱离,让他们有更多的时间专注创作更重要、更驳杂的新闻报道。

美国联合通讯社(AP)在2014年引领潮流,那时他们就开始运用由一家叫Automated Insights(自动化洞察力)的公司开发的文章生成软件来自动生成关于美国的企业利润的文章。从前,某些公司一发布新闻公告,人类记者就赶在截稿日前粗制滥造一些数据类文章。根据自动化洞察力的反馈报告,该软件使得AP的文章产量(从标准化150词提高到300词)提高了整整12倍,从一季度300篇到一季度3700篇。

2016年这项技术也运行得极好,AP开始使用该软件对全国每季度10000场小联盟棒球比赛进行报道;在裁判员话音刚落的几分钟内,根据直播比赛分数的数据所写的文章就能发表。这些报告足以和体育评论员罗杰·安杰尔的文章以假乱真。但这些新闻中缺少有关运动员或是比赛的花哨描写,并且即便出现了如球员互殴之类极具新闻价值的画面,如果没有人被罚下场,也不会出现在新闻中。但是如果有球员表现出职业水准,或者队伍扩大了领先优势,这些新闻往往能一语中的;而这类有深度的数据报告正是有趣体育比赛的支柱。

该趋势已经渗透到其他的新闻企业。华盛顿邮报开始使用一种名为“日光仪(Heliograph)”的项目来进行2016年里约奥运会的追踪报道,随后还在2016年选举期间使用该技术来报道美国全部五十个州近500场的议会、参议院与总统竞选。波因特学院记者智囊团报道,彭博社主编约翰在去年的备忘录上告诫全体媒体雇员:自动化“对行业未来的影响比我们想象的更为重大深远”。

到目前为止,自动化技术还仅限于制造“诸如利润报告或体育比赛之类千篇一律的文章”,尼曼新闻实验室的职员理查德·毕尔顿通过邮件报告,该组织作为哈佛大学尼曼新闻学基金会的一部分致力于对新闻媒体的新进展进行追踪研究。

“通常情况下他们只是进行这一领域的一些前期工作,”毕尔顿说到,“这类文章架构清晰,因此软件轻而易举就能进行解析炮制。”

毕尔顿海说还机器作者在诸如经济报告等领域具有巨大优势,因为该行业信息传播越快其价值就越高。“投资者愿意为能帮他们把鸡蛋放进正确篮子的信息渠道买单。”他说到,“如果他们能够在竞争中早几秒得到消息,就能迅速占据有利地位,而这恰好自动新闻的职能核心。”但自动新闻绝非没有隐患,“人们易于全盘信任自动新闻,因为在我们的概念里‘自动化’可以和‘不败’划上等号。”毕尔顿补充道,“而事实上我们知道编码也是有可能出现失误的。”

举个栗子:美国地质调查局的软件六月份在运行过程中出现了bug,使得机构发布了加利福尼亚州6.8级地震的错误预警,而事实上该地震发生于1952年。本次错误也影响了洛杉矶时报地震版块的算法,他们发布了莫须有地震的推特,尽管事后错误及时得到了纠正。

此外,毕尔顿就引进机器人炮制文章能否使新闻报道质量提升提出了质问。“某为自动化媒体(其实更像是为自动化本身)辩护的论据提出,把生搬硬套的低水平工作留给机器人能让人类记者专注于更有前途的工作,”他不屑道,“当然在某些层面上这是对的,但我认为,正是这些稀松平常的日常情形才能不时提醒记者,还有难得一见的更有意义的工作。这两件事就像是硬币的两面,我们绝不能妄言将工作压力的转交给自动化工具后究竟会发生什么。”

他的关注点还在于,自动化媒体的发展将最终导致更多传媒专业岗位的消失,该行业雇佣人数自1990到2015降低了42%。“我没法确定自动化对我们所讨论的比例影响几何,但这场无可避免的悲剧确实在悄然上演。”毕尔顿补充道。

本文译自 howstuffworks,由 lnm 编辑发布。

赞一个 (9)