DeepMind最近做了个新软件 它能读懂唇语

2019-03-12 19:32:26 阅读(71 评论(0)


AlphaGo背后的DeepMind最近有了新动向,它与哈佛大学的研究人员合作研发出了一套可以读懂唇语的软件。


在哈佛大学最新发表的论文中,他们研发的这个唇语阅读软件LipNet准确率高达93.4%。这个准确率远高于此前研发出来的其他唇语设备。


哈佛大学的研究人员称,这是因为他们采用了不同的方法来训练LipNet的算法。为了让它能更准确的理解唇语,他们给计算机输入了近3万个带有情境的视频片段,每个片段有3秒时长,然后训练算法去匹配每个片段中每条句子对应的唇形和发音,而不是让其匹配每个单词的唇形和发音。


DeepMind最近做了个新软件 它能读懂唇语


通过这个训练,他们的算法就能根据上下文情境,从单个单词的提示就能预测出整个句子。


但论文中提到如此高的准确率也遭受了质疑。因为在该研究中,他们用来训练算法使用的视频片段是经过精心挑选的。


这些视频中的人脸必须面向屏幕,说话时唇形要很明显,而使用的句法必须是标准的。但在真实的语言环境下,人们说话时所使用的句法并不是完全标准的。


Open AI的人工智能方面的专家Jack Clark称,如果要想将这项技术应用到实际情境中,至少还需要在三个方面进行改进,包括增加人们实际对话场景的视频片段,实现多个角度识别唇语以及让算法能预测更多的短语组合或句式。


他还提到称,如果能在实际情境下应用,它会很有用,比如用到助听器中,或者被用来提高人工智能识别语音的准确度和反应速度上。


也有批评认为,它的应用也对公民的言论自由造成了威胁。


不过目前来看,这一切现在看起来还有点远。


未经允许不得转载,或转载时需著名出处

品牌服务大使:
王 娅

雷先生 180****9409 2分钟前预约
张先生 198****8623 9分钟前预约
蔡先生 135****5998 11分钟前预约
田先生 153****3746 15分钟前预约
龙先生 136****5541 15分钟前预约
郑先生 158****6471 21分钟前预约
钟先生 159****4501 24分钟前预约
宋先生 137****8634 24分钟前预约
毛女士 152****4324 32分钟前预约
邹先生 147****4390 36分钟前预约
程先生 138****6726 43分钟前预约
邵先生 137****5743 47分钟前预约
徐先生 180****7980 48分钟前预约
田先生 131****9919 50分钟前预约
余先生 139****7428 50分钟前预约
侯先生 151****5874 51分钟前预约
邹先生 187****5989 54分钟前预约
戴先生 147****6938 55分钟前预约
王女士 170****2006 58分钟前预约
毛先生 138****9822 59分钟前预约