神奇女侠演员下海拍片？都是 ML 算法搞的……这是如何做到的？

程序员的那些事 2019-07-30

（点击上方蓝字，快速关注我们）

女神下海了？

最近 Reddit 的某个不可多描述版块上火了一段不可描述的小视频，主角居然是神奇女侠的扮演者盖尔·加朵（Gal Gadot）。

不过这是一段合成视频，视频中并非盖尔·加朵本人，而是通过 AI 技术手段，把加朵的脸嫁接到其他成人影片女演员的身体上了。

（合成视频中的截图）

是谁做了这段视频？

一个网名为 deepfakes 的 Reddit 用户。在接受外媒 MotherBoard 采访时，他说自己并不是专业研究人员，是一个对机器学习（ML）感兴趣的程序员。不难看出，他的网名就是仿 DeepLearning（深度学习）。

（合成视频中部分片段）

除了神奇女侠的扮演者加朵，deepfakes 还做了其他女星的合成视频，包括：斯嘉丽·约翰逊（漫威的黑寡妇）、艾玛·沃特森（哈利波特系列女主角之一的赫敏）和麦茜·威廉姆斯（权力的游戏中的二丫）。

这种视频他是怎么做的？

deepfakes 并未透露完整细节，只说了利用了多个开源库： Keras、TensorFlow。为了搜集女星的脸部信息，他用到了谷歌图片搜索、网络图库、Youtube 视频。采取到足够素材后，开始用来训练深度学习网络。经过足够多的训练后，系统自动替换脸部信息。

人工智能研究者 Alex Champandard 表示，这种技术不再是像火箭科学那般尖端。用一个消费级的显卡，经几个小时处理也能达到同样效果。普通 CPU 也能做到，只不过更慢，要用「天」来算。

更逼真的假视频

早在 2017 年 7 月份，美国华盛顿大学发布一项新研究，基于现有公开的奥巴马音频和视频片段，人工智能（AI）软件可生成了高度逼真的假视频。口型几乎完美！！！

研究人员最新作品之所以要选择奥巴马，是因为网上有公开的奥巴马演讲高清视频，时长多达数小时。

研究团队用神经网络程序分析了视频中的数百万帧影像，以确定奥巴马脸部的变化，比如：嘴唇、牙齿、嘴角以及下巴周边的皱纹。神经网络程序学习了口型和各种声音之间的联系。

研究人员采集了音频片段（原始音频文件），再把口型和新的音频文件剪辑匹配，再嫁接到新视频。

研究小组表示，他们并没有塑造人物情绪，所以合成的新视频并不完美，有时本该随意的氛围，奥巴马表情显得过于严肃。不过他们也会尝试，神经网络学习从音频文件中预测人物情绪，从而产生相应的视觉效果。

看完本文有收获？请转发分享给更多人

关注「程序员的那些事」，提升编程技能

淘口令：复制以下红色内容，再打开手淘即可购买

范品社，使用￥极客T恤￥抢先预览（长按复制整段文案，打开手机淘宝即可进入活动内容）

近期，北京地区正常发货，但派件时间有所延长