AI复活蒙娜丽莎,与你有个约会

null

“蒙娜丽莎”的神秘画面笑容在世界各地广为人知,但这张着名的脸最近展示了令人吃惊的全新表现形式,由人工智能(AI)提供。三个视频片段展示了蒙娜丽莎在移动嘴唇并转过头时令人不安的例子。她是由卷积神经网络创建的 - 一种人工智能处理信息的人工智能,分析和处理图像。

研究人员训练该算法以了解面部特征的一般形状以及它们相对于彼此的行为,然后将该信息应用于静止图像。结果是来自单个帧的新面部​​表情的逼真视频序列。

对于蒙娜丽莎视频,AI从三个人类主题的数据集中“学习”了面部动作,产生了三种截然不同的动画。虽然三个片段中的每一个仍然被认为是蒙娜丽莎,但是训练模型的外观和行为的变化给“生活肖像”带来了明显的“个性”,Skolkovo科学与技术研究所的工程师Egor Zakharov,视频中解释说,三星AI中心(均位于莫斯科)。

扎哈罗夫和他的同事们还从阿尔伯特爱因斯坦,玛丽莲梦露和萨尔瓦多达利等20世纪文化偶像的照片中制作了动画。研究人员在5月20日在线发表在预印本期刊arXiv上的一项研究中描述了他们的研究结果,这些结果未经过同行评审。

null

制作这些原始视频(称为“深度伪造”)并不容易。人头几何复杂且高度动态; 研究作者写道,头部的3D模型具有“数千万个参数”。

此外,根据该研究,人类视觉系统非常擅长识别3D模拟人头中的“甚至是轻微错误”。看到几乎看起来像是人类的东西 - 但并不完全 - 会引发一种被称为不可思议的山谷效应的深刻不安的感觉。

AI之前已经证明可以产生令人信服的深度伪造,但它需要所需主题的多个角度。对于这项新研究,工程师们将AI引入了一个非常大的参考视频数据集,展示了人脸的实际效果。科学家建立了适用于任何面部的面部标志,用于教导神经网络面部表现如何。

null

然后,他们训练AI使用参考表达式来映射源特征的移动。研究人员报告说,这使得人工智能能够创建一个深度伪造,即使它只有一个图像可供使用。

更多源图像在最终动画中提供了更加详细的结果。科学家写道,用32个图像创建的视频,而不仅仅是一个,在用户研究中实现了“完美的真实感”。

null

打开APP阅读更多精彩内容