DeepMind最近做了个新软件 它能读懂唇语

2019-04-18 16:19:20 阅读(231 评论(0)


AlphaGo背后的DeepMind最近有了新动向,它与哈佛大学的研究人员合作研发出了一套可以读懂唇语的软件。


在哈佛大学最新发表的论文中,他们研发的这个唇语阅读软件LipNet准确率高达93.4%。这个准确率远高于此前研发出来的其他唇语设备。


哈佛大学的研究人员称,这是因为他们采用了不同的方法来训练LipNet的算法。为了让它能更准确的理解唇语,他们给计算机输入了近3万个带有情境的视频片段,每个片段有3秒时长,然后训练算法去匹配每个片段中每条句子对应的唇形和发音,而不是让其匹配每个单词的唇形和发音。


DeepMind最近做了个新软件 它能读懂唇语


通过这个训练,他们的算法就能根据上下文情境,从单个单词的提示就能预测出整个句子。


但论文中提到如此高的准确率也遭受了质疑。因为在该研究中,他们用来训练算法使用的视频片段是经过精心挑选的。


这些视频中的人脸必须面向屏幕,说话时唇形要很明显,而使用的句法必须是标准的。但在真实的语言环境下,人们说话时所使用的句法并不是完全标准的。


Open AI的人工智能方面的专家Jack Clark称,如果要想将这项技术应用到实际情境中,至少还需要在三个方面进行改进,包括增加人们实际对话场景的视频片段,实现多个角度识别唇语以及让算法能预测更多的短语组合或句式。


他还提到称,如果能在实际情境下应用,它会很有用,比如用到助听器中,或者被用来提高人工智能识别语音的准确度和反应速度上。


也有批评认为,它的应用也对公民的言论自由造成了威胁。


不过目前来看,这一切现在看起来还有点远。


未经允许不得转载,或转载时需著名出处

点击获取方案