登录注册   忘记密码

想让欧巴马说什么都可以!最新AI「对嘴」技术可伪造几可乱真的影片内容

眼睛看到的不一定可靠!过去,我们用Photoshop 修出各种「照骗」,但最新AI 技术,连影片中谈话者的嘴形和声音都可以修改,甚至逼真到难以从影片中察觉异状。该研究可将声音档转换为说话嘴形,并套用在其他影片中,改变影片主角原本的说话内容;也就是,虽然影片片段是真的,但说话的内容是假的。


仅分析17 小时欧巴马演讲影片,所需资料量较过去小

华盛顿大学研究团队发表一篇名为「同步欧巴马:学习如何用声音同步嘴形」的研究,而研究成果就是一系列美国前总统欧巴马的「造假」影片。


该研究透过深度学习演算法,让软体从欧巴马过去的演讲影片中,学习如何将声音档转换为嘴形变化,因此,当替影片配上新配音时,这套软体可将新配音转换为嘴形变化,再将嘴形移植到既有影片中。

AI-e1500279009504.png

▲ 该研究透过神经网路技术,从欧巴马过去的演讲影片中学习如何将声音档转换为嘴形变化,再将嘴形移植到既有影片中。(Source:UW News)

虽然影片中的音档确实来自欧巴马过去说过的话,但说话场景却完全不同。就像示范影片中,左边是音档来源,右边是另一场完全不同的演讲,但研究者透过演算法,将两者结合成全新的影片。


研究者表示,之所以选择欧巴马为实验对象,原因在于网路上可轻易取得大量欧巴马公开谈话的高画质影音档,适合用来训练人工智慧。


和过去研究不同的是,该软体不需要扫描大量的演讲影音资料,也不需要分析不同人说出相同句子的嘴形,才能学会转换声音;其仅需要既有的影音素材即可,所需成本和规模更小。


研究者指出,该研究仅分析17 小时的欧巴马演讲影片就达到此成果,希望未来可以将分析所需影片长度压缩到1 小时。


希望用于优化历史影音档案和视讯工具

研究者表示,希望这款软体可帮助优化历史纪录的影音档案,或是用于改善Skype 这类的视讯工具品质。例如,用户可以收集他们自己说话的影片,并用以训练软体,之后当他们使用视讯工具时,影像便能自动符合说话内容,因此就算网路连线品质不佳,也能让视讯画面保持顺畅。


不过,外界也担心,这套软体若遭恶意人士利用,后果不堪设想。例如,可先利用声音合成技术模仿出欧巴马的声音,再加上这套已经训练好、可将欧巴马声音转换为嘴形的模型,即可让欧巴马说出从未说过的话。


事实上,人工智慧新创Lyrebird 已经透过机器学习开发出声音模拟技术。该公司号称,只要1 分钟的声音样本,即可模仿任何人说话。


您的评论:

0

用户评价

  • 暂无评论