@ 2016.10.20 , 16:00
20

语音识别新突破:微软AI小胜人类专家

[-]

将人类之间的对话转录成文字一直是机器的噩梦。即使语音文件质量很高,没有任何背景噪音,算法依旧要努力区分不同的声音,中断,犹豫,纠正,以及冗长会话中的细微差别。

微软研究院的一篇新论文宣称他们的语音转录技术已经能小胜人类对话转录专家,即使人类专家的文本已经接受了另外一个人的复核。研究团队并没有将此成就归功于算法或者数据上的突破,而是对现有的AI架构进行调整。

为了测试他们的算法能否跟人类分出胜负,研究者们首先要确定一个基线。微软找来一个第三方,他们有一个确认100%正确转录的音频。测试分两个阶段:一个人听写音频,第二个人听音频并纠正转录的错误。比照正确的文本后,专业人士的错误率为5.9%和11.3%。

在学习完2000小时的人类讲话后,微软的系统也听写了同样的音频,错误率为5.9%和11.1%。这0.2%的差距就是少了12处错误。

微软的下一个挑战就是让这一水平的语音识别在更加嘈杂的环境里工作,比如在车内或者在趴体上。视线这个对微软而言极为重要,而且它也远远超出了转录本身。

[-]

这项研究是微软力图让人机对话更加流畅和轻松的重要一步。如果电脑无法理解一个人的画,那么它完成指令或者回答问题就会更加困难。微软要想取得其他方面的突破,这是基础。今年早些时候,微软CEO萨提亚·纳德拉说人工智能是该公司的未来,而会话能力则是它的基石。

尽管它取得了成功,但是人工智能系统跟人类转录员还有一个巨大的区别:它不能理解对话中那些细微的变化,比如“嗯”。出现“嗯”的时候,往往是一个人在对话中正在思考,或者是让对方继续说话,比如“嗯哼”。专业的人类转录员可以注意到这是犹豫还是确定,但是机器就会忽视这些微小的线索,它们无法理解其中的含义,也不知道为什么会发出这样的声音。

本文译自 quartz,由译者 许叔 基于创作共用协议(BY-NC)发布。


给这篇稿打赏,让译者更有动力
支付宝打赏 [x]
您的大名: 打赏金额:

4.7
赞一个 (9)

TOTAL COMMENTS: 20+1

  1. 火星网友
    @11 months ago
    3285987

    情报界的福音

  2. 3285991

    以后两口子离婚估计是这样的:siri,等我老婆回来,自动关闭电动门窗,打开燃气,十分钟后点火。此为最高权限,不可更改。

    [54] XX [5] 回复 [0]
  3. 艾尼路
    @11 months ago
    3285994

    别人家的小娜~反正我电脑和手机上的都蠢的跟猪差不多

    [41] XX [0] 回复 [0]
  4. 3285995

    可小冰还是那么笨

    [11] XX [3] 回复 [0]
  5. 3286000

    粉红色键盘是亮点

  6. 3286010

    我們不能說一張紙很笨,它不會思考。
    計算機是自動的,但不是智能的。
    智能設備所能展現的都是已經設定好的操作反饋。
    人們覺得它們智能,是因為人們不曉得這樣的“智能”背後有多少判斷及選擇等其他語句。
    盡可能多的給出應對各種情況的反饋,讓你感覺它似乎智能。而實際上這些反饋都是經過了千百萬次的測試,發現了不足,補充了解決方案才出現在你眼前的。計算機的進步在於硬件的更新換代,更美麗的圖形界面,但本質上的計算機還是DOS時代的一行行明確指令。它還不會自己為自己增加/删除/修改自己覺得自己所需要/不需要/不足的能力。
    Bug是沒有考慮到的情況,修復就是增加針對Bug當下操作的反饋。
    計算機不是智能的,它只是自動了。
    時刻等待用戶給出的操作指令,即時的反饋已經設定的解決方案。這就是計算機所做的。

    以上,就現在的科技而言,使用“Artificial Intelligence / 人工智能”這個詞還是為時過早。

    [22] XX [30] 回复 [0]
  7. 3286016

    我們不能說一張紙很笨,它不會思考。
    計算機是自動的,但不是智能的。
    智能設備所能展現的都是已經設定好的操作反饋。
    人們覺得它們智能,是因為人們不曉得這樣的“智能”背後有多少判斷及選擇等其他語句。
    盡可能多的給出應對各種情況的反饋,讓你感覺它似乎智能。而實際上這些反饋都是經過了千百萬次的測試,發現了不足,補充了解決方案才出現在你眼前的。計算機的進步在於硬件的更新換代,更美麗的圖形界面,但本質上的計算機還是DOS時代的一行行明確指令。它還不會自己為自己增加/删除/修改自己覺得自己所需要/不需要/不足的能力。
    Bug是沒有考慮到的情況,修復就是增加針對Bug當下操作的反饋。
    計算機不是智能的,它只是自動了。
    時刻等待用戶給出的操作指令,即時的反饋已經設定的解決方案。這就是計算機所做的。

    以上,就現在的科技而言,使用“Artificial Intelligence / 人工智能”這個詞還是為時過早。

    [2] XX [16] 回复 [0]
  8. 烧了个饼
    @11 months ago
    3286043

    @Ain:
    最大的问题是,人类并不了解智能的本质,人类本身也是机械化的数据处理输入输出,说不定计算机和我们一样呢?

  9. 蕾米莉娅!
    @11 months ago
    3286092

    语音识别的话其实中国的科大讯飞也挺牛逼的。。

  10. 3286180

    大脑的本质也不过是一堆堆的神经元放电而已

  11. sandersyao
    @11 months ago
    3286249

    @Ain: 这么看 人类也很笨 要花更长的时间 学习 听说读写 你觉得谁更智能哪?

  12. 哼哼哼
    @11 months ago
    3286277

    憨豆入职微软啦~??

  13. 3286301

    小娜有时候要开很久…这点比siri体验要差点…

  14. 商周知
    @11 months ago
    3286455

    我从未见过如此厚颜无耻之人(´இ皿இ`)

  15. justinBilly
    @11 months ago
    3286790

    @艾尼路: 文章只是说转录。。。

  16. Finalpraise
    @11 months ago
    3286837

    录个报菜名试试

  17. 3286904

    @sandersyao: 但生物的学习是主动的,计算机的学习……甚至不能叫学习。

  18. 3286905

    @烧了个饼: 当然不一样啊……差很多诶……

  19. 3354300

    地方viuhihuoooi90

发表评论


24H最赞