Geek
MIT开发出能分离不同乐器声音的应用
mit|youtube
当你制作甜品的时候,将淀粉、糖、鸡蛋等材料混合在一起,进行烘烤。这一过程和演奏音乐有些相像,不同的乐器,不同的声音特质,按照某种既定规则交织在一起。当演奏过程被记录到音频文件中,就像是蛋糕烘烤出炉,等待人们的品尝。没有办法逆转这一过程,将淀粉和糖从中析出还原。所以,也没有办法将音频文件中的不同乐器声单独摘出来……按道理是的吧?
麻省理工学院计算机科学与人工智能实验室的研究人员开发出了一款应用程序,利用它可以识别出合奏演出视频/音频文件中不同的乐器声。当它生成视频中出现过的乐器列表之后,用户只需要点击选中特定的乐器,就能直接获取视频中该乐器的单独演奏的效果。
这可不像说起来那么轻松,实际上,之前还没有哪种傻瓜式应用程序能做到这一点。显出特定的乐器声音,比消除背景杂音凸显人类对话声音的操作要难得多,因为乐器演奏的时候,不同声音合并在一条音轨上,音调音节的起伏彼此相合。而之前的音频处理技术,通过频率之类的参数,来消抹或截取相关声音,需要调音师极多的精细操作。
他们的神经网络深度学习系统对时长60小时的各种音乐家演奏视频进行分析训练。最终,它能够识别出20多种不同的乐器,然后自动将每种乐器的声音隔离出来。用户只需要点击他们想要听到的乐器,就能单独得到一段音频。以往的音响工程师要想实现这一效果,通常需要数个小时的处理和调整。
CSAIL的研究人员指出,随着神经网络系统进一步升级,它将能分辨同一族乐器之间的差异。未来,它可以被用于混音处理和重新灌制唱片,哪怕母带出现损毁也没有关系。具体的应用方向,比如说在演出完成录制后,还可以提高小号的声音,同时降低钢琴的音量以改善整体混音效果。或者,对还处于学习阶段的音乐家来说,用该软件可以将著名乐队中特定的演奏者的演奏效果提取出来加以揣摩学习。
该软件还有可能彻底改变DJ行业,或许这也是麻省理工学院不想此时就推广应用程序的原因。但是,操作如此便捷的音频处理程序是每位调音师和混音DJ都想放到自己工具箱中的强大工具。