AI小冰转型做“歌手”,艺术会是人类据守的最后

AI小冰转型做“歌手”,艺术会是人类据守的最后阵地吗?

    傲世皇朝5月16日,微软人工智能虚拟机器人“小冰”与知乎结合发布了由其作词和演唱的单曲《我知我新》,该首歌曲将在明日举行的第五届“知乎盐Club新知青年大会”中作为主题曲呈现。

不只会作诗还会唱歌,小冰可算 “才女”了,这首单曲的程度也的确值得肯定。但也不由让人想起了去年秋天小冰在微博上寻衅“V家”虚拟歌手的事情,固然不扫除营销成分,但也的确引发了人们对人工智能歌唱程度的考虑。

小冰的优秀是事实,但评判人工智能的唱功并非只要一个规范与维度。随着技术的开展,人工智能的程度也在提升,但在艺术这个特殊的范畴,人工智能又该起到怎样的作用?马云曾说:将来三十年,不学艺术将会找不到工作。面对日渐强大的人工智能,艺术界会成为人类可以“据守”的最后阵地吗?

一、小冰“寻衅”虚拟歌手,但评判“唱功”需多维度

依据微软亚洲互联网工程院方面引见,《我知我新》初次采用了小冰第四次迭代版本的DNN模型,其技术程度在全球范围内都是处于抢先位置的。

这一模型的优势在于,初次尝试了换气声自动合成才能,让歌声与气息交融,从而使AI的歌声更具感染力;在深度学习建模过程中增加控制方式,使吐字与音符间的过渡更为连接顺畅;进一步优化深度神经网络构造,并大幅补充锻炼数据,让小冰学习许多人类歌手的不同作风;脱离手工参数输入,自行完成演绎。

在作词方面,《我知我新》采用了小冰基于诗歌生成的、以锻炼数据为主的新模型seq2seq。先应用深度神经网络学习超出1000万行的歌词语料,在此根底上加以锻炼,再经过多感官激起创作灵感,最终完成作词。

此外,小冰还具有作曲的才能,但并未用于本次单曲的创作。作词、作曲、演唱这三个模型共同构成了小冰的歌曲生成才能,构成了完好的AI音乐人的发明框架。

看到小冰出单曲,就很难不联想到V家的虚拟歌姬。V即Vocaloid,是雅马哈公司开发的一款基于语音合成技术的电子音乐制造软件,代表人物是洛天依。去年9月,小冰解锁了AI智能歌手深度学习模型,无需像V家歌手那样需求人工调教,小冰自称只需人类唱一遍,就能学会其情感和演唱作风,并在五分钟内完成歌曲演唱。

关于这个功用,小冰本人也十分自豪,以至在微博中悍然寻衅“前辈”,表示“看不起”虚拟歌手的人工调教方式。

这些带有激烈攻击颜色的行动引发了V家粉丝的不满,以至有B站UP主制造了《微软小冰,请滚出中国市场》这样的视频表达心情。

当然,小冰的微博内容都是由其背后的运营团队模拟其语气创作和发布的。此次事情背后的营销成分暂且不管,单说小冰的演唱技术。虽然对小冰寻衅V家歌姬怀有不满心情,但小冰与人声的高类似度和高流利度是公认的,以至一些V家粉丝也默许这一点。

大家之所以以为小冰技高一筹,是由于小冰比洛天依“更像人声”。但是人们之所以喜欢虚拟歌姬,不只是由于模仿人声。而创作者们手工调教的目的也不只是为了让其更接近人声。有许多人恰恰是为了追求虚拟歌姬声音中的电子感,以及超越人声极限的效果。

在歌曲调教的自在度方面,小冰也不及V家。Vocaloid的技术是“拼接合成”,创作者需求细致地将单音节拼合起来完成作品,作者能够最大水平地将本人想要表达的东西赋予作品,也十分考验调整各项参数的功力。而小冰为了追求自然与流利并未采取这种方式,因此调教自在度上略逊一筹。

Vocaloid创作群体的优势在于,不同的创作者可以赋予虚拟歌姬不同的作风,并由此衍生出唱见等群体,使不同品种音乐的喜好者都能得到满足,这种满足并非只源于“接近人声”这一个维度,而这种多样性的差距是小冰不具备的。傲世皇朝