端科技您的位置:首页 >通信 >

Google DeepMind更贴近人类

DeepMind的人工智能研究人员利用神经网络创造了一些最逼真的人类语音。AI称为WaveNet,它承诺对计算机生成的语音进行重大改进,并最终可用于数字个人助理,如Siri,Cortana和亚马逊的Alexa。该技术通过从英语和普通话人口中抽取真实的人类语音来产生声音。在测试中,发现WaveNet生成的语音比其他形式的文本到语音程序更加真实,但仍然没有真正令人信服。

Google DeepMind更贴近人类

在500次盲测中,受访者被要求以1到5的等级判断样本句子(其中5个是最现实的)。WaveNet在英语中被评为4.21,在普通话中被评为4.08(实际人类语言在测试中被评为4.55英语和4.21普通话)。在那一方面,WaveNet成功地超越了其他语音方法。

当其他人工语音生成器专注于语言时,WaveNet针对正在产生的声波,分析原始音频信号波形并对其进行建模。在YouTube上听钢琴独奏后,研究人员还使用相同的技术制作音乐。

“WaveNets为TTS,音乐生成和音频建模提供了很多可能性。使用深度神经网络直接生成时间步长的事实对16kHz音频起作用是非常令人惊讶的,更不用说它优于最先进的TTS系统。我们很高兴看到我们接下来可以做些什么,“Deepmind在博客文章中说。

Deepmind还发表了一篇论文,详细介绍了该技术。

该研究机构还负责创建一个AI系统,以击败今年的冠军Go球员。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。