Deezer的AI可以根据情绪强度归类歌曲

VentureBeat称，Deezer研究员已经研发出了能够将某些歌曲与情绪和强度联系在一起的AI系统，其发布在Arxiv.org新出版的一篇名为《基于深度神经网的音频歌词音乐情绪检测》的论文里。

为了判断一首歌的情绪，该团队考虑了音频信号和歌词。一开始，他们把音频信号投入一种带有重建语言语境模型的神经网络。然后，通过使用一种存储超过100万首当代歌曲的元数据集——音乐推荐数据集( Million Song Dataset MSD)，来教它怎样判断一首歌的情绪。再用Last.fm数据集，这个数据集可以分配标识给来自50多万个独一无二标签的轨迹。许多标签都是和情绪相关的，从这些标签中，超过1万4000多个英文单词被赋予两个刻度等级，和一个词是多么的积极、消极、安静、活跃联系在一起，来训练这个AI系统。

MSD只是包含歌曲元数据，而不是歌曲本身，所以该团队用些像歌名、艺术家、专辑名一样的身份标识，将所有信息给Deezer的目录罗列出来。约有60%的结果数据集(18,644条轨迹)用来训练AI，剩下的则用来验证和进一步测试该系统。

人们认为这种系统可以进一步观察音乐、歌词和情绪如何联系。

最后，研究员称，AI相比于更传统的方式，能够更好地检测出歌曲是多么平静和活跃，但当检测歌曲有多么积极或消极时，却和传统方式表现无异。“似乎这次的收获就是我们的模型，尤其在预测“价”时，能够揭晓利用音频和歌词之间的中间联系。”研究员在论文中写道。

论文中也提到过，为了真的借助这个产品，一个带有同步歌词和音频的数据库将会大有帮助。如果这样的数据库存在，那么该团队认为他们可以更精确的判断模糊不定的音轨情绪，因为“某些情况，听众之间会有很大的波动。”(比如人们不会总是觉得一首歌是积极的还是消极的)。最后，研究员认为，这种系统可以进一步研究音乐、歌词和情绪是如何联系的，还有可能区分和发现高音量时未贴标签的数据的深度学习模型。

这与Deezer之前第一次试图用AI区分歌曲来看，相去甚远。去年，Deezer用在Sónar festival的一项挑战回答了这个问题：“用户在家时，我们怎样检测他们是在听歌还是恰好在推荐歌曲呢？”。理论上，在未来学习中，Deezer能够使用这类机器自动地区分和归类歌曲——不仅仅是用艺术家的名字或音乐种类这种基础的元数据，而是一些更细致入微的东西，比如情绪。

本文译自 theverge，由 Ayeshanyoga 编辑发布。

赞一个 (2)

煎蛋

人工智能

Deezer的AI可以根据情绪强度归类歌曲

公告栏

广告

广告