@ 2018.03.06 , 08:00
23

百度刷新了语音克隆技术的记录

百度刷新了语音克隆技术的记录
图片为百度语音服务界面

最近,“中国的谷歌”*百度发布了一份AI白皮书,展示了其在人工智能领域的最新成果:借助神经网络技术,他们的AI可以在输入仅仅一秒钟时长的声音片段后,就模仿出说话者的声音。

该软件不仅可以模拟输入语音,还可以改变原有的风格、变换性别身份、附加不同的口音。

可以在此处GitHub收听生成的示例。

之前几次技术迭代升级中,该系统能够通过对较长的语音材料进行分析,实现声音复制。 2017年,百度Deep Voice研究团队开发出了可以用30分钟的输入材料,来实现声音克隆的技术。

Adobe旗下有一款名为VoCo的程序,它可以在听取一段20分钟音频后,复现出带有音源的特征的声音;而加拿大的一家名为Lyrebird的创业公司可以只用一分钟的音频输入克隆出一个声音。

现在,百度进一步将用作培训材料的原声音频时长缩短为几秒钟。

好吧,整个过程看起来似乎是90年代流行的技术竞赛和革新升级方式,不过想想那个年代里有名的电影《小鬼当家》或《尖声惊叫》,我们可以为这项技术想出一些很有价值的应用方向。

比如说,当你把孩子独自留在家中的时候,你的孩子可以用你的声音和屋外的人交谈,来打消暗处可能存在的不良窥伺;或者为丧失语言能力的人重建他们的声音斯蒂芬霍金

这项技术也可用来个性化我们智能设备上的数字助理比如苹果siri和提供更自然的语音翻译服务。

但是,与许多技术一样,语音克隆技术也存在被滥用的风险。

《新科学家》报道说,该程序产生的克隆语音,足以骗过智能设备上的语音识别系统,实际上通过率达到95%以上。

对人类进行的测试就像柯南中的蝴蝶变声器,看看受测者是否能发现,对方是通过克隆软件模拟自己熟人的声音。结果受骗率高达4分之3.16。这就暗示了该款软件被用于欺诈的可能性。

去年,AI就已经能成功地替换或改变——甚至无中生有——视频中个人的面貌。目前,互联网上的大部分相关应用只是通过将尼古拉斯凯奇插入指环王系列来制造欢笑。

但现在再加上能够克隆声音的技术,我们很快就会受到更多“假新闻”的侵扰。眼见耳听不一定为实,以后我们可能会看到一段极其真实的虚假视频,真实世界的政客们在其中做出说出了非同寻常的事情。

仅仅使用文字或Photoshop来愚弄大众已经被证明并不需要多高的技术含量;如果这些更先进的技术落到错误的手里,人类社会的麻烦会变得更多。

本文译自 sciencealert,由译者 majer 基于创作共用协议(BY-NC)发布。


给这篇稿打赏,让译者更有动力 !
支付宝打赏 [x]
您的大名: 打赏金额:

4.7
赞一个 (8)

+1

  1. 3728393

    吾系东北黑谢会,你的鹅子在我们手类…这种段子终于可以成为历史啦!

  2. 3728395

    所以我的苍老师充气娃娃什么时候可以原因重现?

  3. warhorse
    @4 months ago
    3728425

    赶紧倒闭吧

  4. 我爱西红柿
    @4 months ago
    3728432

    反应了一会才明白这是百度不是腾讯的技术

  5. 鸡儿要放假
    @4 months ago
    3728441

    前排坐好,看蛋友花式diss

  6. 3728442

    声纹分析……这个还是很厉害的。应用范围也很广泛。
    不要总想着人声,其他声音呢?比如核潜艇和武装直升机的声纹经过适当分析和伪装后,有很大的迷惑性。声纹监控的智能反直升机地雷应该是可以被误导一下的。

  7. 3728458

    百度这一两年有点知耻而后勇的意思,不错,加油。

  8. 3728469

    deep fake再加这个技术,可以随心所欲让人公开认罪了。

  9. 西早哥
    @4 months ago
    3728487

    以后收到朋友借钱的短信, 打电话确认也行不通了,唉

  10. 西早哥
    @4 months ago
    3728488

    以后收到朋友借钱短信,打电话确认这招也不管用了.唉…..
    哦,我没有朋友
    对了,我也没有钱.哈哈哈哈哈哈

  11. 世间一双眼
    @4 months ago
    3728499

    以后一切丑闻视频都可以说是伪造的了

  12. 克劳利
    @4 months ago
    3728533

    可以模仿已经死掉的人说话唱歌,这样就等于永远不死了(感觉比起被骗子用,被zf用更恐怖

  13. 狂犬病专治
    @4 months ago
    3728579

    “中国的谷歌”,MLGB!

  14. 千反田麻薯
    @4 months ago
    3728627

    可以做更多坏事了

  15. 喵喵喵?
    @4 months ago
    3728673

    @克劳利: 这么说李中堂危险了?

  16. 称呼太长
    @4 months ago
    3728865

    并不是一件值得高兴的事情。

  17. 人工脑
    @4 months ago
    3729212

    变声器✓
    可以开始女装了

  18. 3729249

    这么说来deepfake和变声可以让一切人被认罪但也可以作为一切有权有钱的人脱罪的说辞了

  19. 3729403

    骗子又多了一种手段,恭喜百度

  20. 3729456

    说真的这种技术真要民用的话,想想看,因犯罪而采集的录音证据有很大几率是伪造的,法庭采用的程度将会减低。受害者们又会少一项证据。

  21. 3729639

    法庭成不了证据,群情一定揪住不放。双输。

  22. 奥拉拉
    @4 months ago
    3729725

    以百度的恶毒本性,你以为会被用到什么好地方?

发表评论


24H最赞