神奇女侠演员下海拍片?都是 ML 算法搞的……这是如何做到的?
(点击上方蓝字,快速关注我们)
女神下海了?
最近 Reddit 的某个不可多描述版块上火了一段不可描述的小视频,主角居然是神奇女侠的扮演者盖尔·加朵(Gal Gadot)。
不过这是一段合成视频,视频中并非盖尔·加朵本人,而是通过 AI 技术手段,把加朵的脸嫁接到其他成人影片女演员的身体上了。
(合成视频中的截图)
是谁做了这段视频?
一个网名为 deepfakes 的 Reddit 用户。在接受外媒 MotherBoard 采访时,他说自己并不是专业研究人员,是一个对机器学习(ML)感兴趣的程序员。不难看出,他的网名就是仿 DeepLearning(深度学习)。
(合成视频中部分片段)
除了神奇女侠的扮演者加朵,deepfakes 还做了其他女星的合成视频,包括:斯嘉丽·约翰逊(漫威的黑寡妇)、艾玛·沃特森(哈利波特系列女主角之一的赫敏)和 麦茜·威廉姆斯(权力的游戏中的二丫)。
这种视频他是怎么做的?
deepfakes 并未透露完整细节,只说了利用了多个开源库: Keras、TensorFlow。为了搜集女星的脸部信息,他用到了谷歌图片搜索、网络图库、Youtube 视频。采取到足够素材后,开始用来训练深度学习网络。经过足够多的训练后,系统自动替换脸部信息。
人工智能研究者 Alex Champandard 表示,这种技术不再是像火箭科学那般尖端。用一个消费级的显卡,经几个小时处理也能达到同样效果。普通 CPU 也能做到,只不过更慢,要用「天」来算。
更逼真的假视频
早在 2017 年 7 月份,美国华盛顿大学发布一项新研究,基于现有公开的奥巴马音频和视频片段,人工智能(AI)软件可生成了高度逼真的假视频。口型几乎完美!!!
研究人员最新作品之所以要选择奥巴马,是因为网上有公开的奥巴马演讲高清视频,时长多达数小时。
研究团队用神经网络程序分析了视频中的数百万帧影像,以确定奥巴马脸部的变化,比如:嘴唇、牙齿、嘴角以及下巴周边的皱纹。神经网络程序学习了口型和各种声音之间的联系。
研究人员采集了音频片段(原始音频文件),再把口型和新的音频文件剪辑匹配,再嫁接到新视频。
研究小组表示,他们并没有塑造人物情绪,所以合成的新视频并不完美,有时本该随意的氛围,奥巴马表情显得过于严肃。不过他们也会尝试,神经网络学习从音频文件中预测人物情绪,从而产生相应的视觉效果。
看完本文有收获?请转发分享给更多人
关注「程序员的那些事」,提升编程技能
淘口令:复制以下红色内容,再打开手淘即可购买
范品社,使用¥极客T恤¥抢先预览(长按复制整段文案,打开手机淘宝即可进入活动内容)
近期,北京地区正常发货,但派件时间有所延长