微软新技术：模仿演讲者语音将英文直接转换成中文

在视频当中，大屏幕的左侧是由计算机将识别出的演讲者语音转换出的文字，右侧则是机器翻译出的中文。微软研究带头人之一 Rick Rashid 在一次演讲当中向公众展示了微软新语音识别技术的成果。

这是在好玩的事情开始时（#有趣的事才刚刚开始）。演讲者说，微软分析了成千上万的数据，并且因此能得到说出的翻译出的中文（#由此得到较为确切中文翻译）。最后一个会踢的人（#最重要的是）：当演讲者想系统中喂了一个小时的他自己的声音（#演讲者为了“训练”系统，对着语音识别系统说了一个小时），最终软件能说出中文了，用他自己的声音（#最终软件能学着演讲者的声音说出不那么地道的中文了）。

这很难以理解。是什么核心科技运营着工具（#是什么样的科技打造了这个神奇的工具）？根据微软研究领头人Rick Rashid的说法，那个给出演讲的人（#......）

"仅仅两年前，研究者在微软研究中心和多伦多大学做了另一个突破（#微软研究中心和多伦多大学的研究者取得了另一个重大突破）。通过使用一个叫‘深度神经网络’的技术，这项技术根据人类大脑活动规律（#T皿T），研究者相比先前的方法能够训练更有判别力和更好的演讲识别器（#相比先前的语音识别方法，研究者能够依此制作出更高级的语音识别器。）

我们已经能够降低演讲文字错误率达到30%，和先前的方法相比（#......）。这意味着错误率在每7-8个单词，而不是4-5个单词错误（#这意味着照比先前的错误率，每4-5个单词一次，现在的错误率可以下降到每7-8个单词一次。）"

这个视频是哦很值得你的几分钟（这个视频只有几分钟时间，但是很值得你看看。）未来，正在来了。（#T皿T）

#发现学机器说话好难啊！尽管视频中，中文翻译还是有些蹩脚，但是照比很多机器翻译结果已经有了十分明显的进步了。只是，语言文字，毕竟还是高级智能的产物，计算机模拟人类说法还有很长的路要走。

本文译自 :TheNextWeb，由 pwwp 编辑发布。

赞一个 (0)

煎蛋

无厘头研究

微软新技术：模仿演讲者语音将英文直接转换成中文

公告栏