“ZAO”火爆背后的AI换脸技术有多可怕?隐私泄露?法律风险?
The following article comes from 引力山丘 Author 学技术就上
30日晚间,一款名为“ZAO”的换脸社交软件在朋友圈刷屏,不少科技圈人士坦言“刷了一整夜”,而ZAO的创始人正好为陌陌总裁、首席运营官王力。
陌陌还推出了哈你、是他、瞧瞧、Cue、赫兹、MEET等六款社交类产品,除了哈你和是他为两年前和一年前推出外,后四者均为今年推出的新款社交产品。
01
“ZAO”能干啥?
根据“ZAO”应用商店的介绍,这是一款使用顶尖AI技术的换脸神器,仅需一张照片,就可以“出演天下好戏”,玩转所有表情包和经典影视片段。
该APP主要分为“造视频”“造表情”“好友”“我的作品”四大板块。其中“造视频”板块又由推荐、合演、名场面、换装、爱豆同台组成,进一步点开隐藏弹窗,还可以解锁演、扮演角色、剧情、影剧、演员等分类素材。对于视频中出现的多人角色,用户可以选择任一角色进行替换,替换照片可以即时拍摄,也可以从相册选择。
在“造表情“功能里,用户可以将动态表情包中的脸换成自己的,目前可选表情包有亚洲舞王谢飞机、还珠格格、超越妹妹、中年王子黄晓明、甄嬛传等31个分类。
另外用户还可以通过添加好友,使用对方的面孔合演视频,可以想象一下甜宠剧里的男女主角换成了你和你的女朋友的脸或许也是一种奇妙的体验?
笔者也在第一时间体验了其功能,选择了七日最热门里“演女神”章子怡的影视角色视频,最开始的时候因用户太多而出现了前面几千个人排队的情况,大概等了5、6分钟才生成换脸后的视频。不过这种情况很快得到解决,几秒种便可以制造出换脸视频。
一番体验下来,笔者觉得换脸后的表情眼神动态呈现上确实值得称道,但脸部轮廓方面如若实现自然贴合,对用户的拍照技术、脸部角度、甚至长相都提出了更高的要求,除非脸型与视频原角色比较像才不会显得违和。而目前换脸后的视频很容易看出被替换过。其实,ZAO某种程度上就像是视频版的“天天P图”,只不过后者是静态的换脸,前者则是动态“换脸”。
02“ZAO”背后的AI换脸技术有多可怕?
AI换脸技术的鼻祖Deepfakes一经发布,就冲出天际了。
这里有一段神奇的视频,请擦亮眼睛观看。
因为讲话的人类,中途从比尔·哈德,变成了施瓦辛格:
行云流水。说不清什么时候,已经换好了。
所以,如果有小伙伴没看清,可以参考以下:
这是比尔·哈德。
这是施瓦辛格。
后来,施瓦辛格一转头,又变回了比尔·哈德,毫无拼接痕迹:
△ 比尔哈德口型瞩目
由于真伪难辨,此处郑重说明,比尔·哈德才是这集柯南秀 (原本请来的) 嘉宾。
上面的换脸成果展,是从高清视频 (1080p) 里截来的,视频出自一个名叫ctrl shift face的团队。
鬼斧神工,引起了推特用户的大规模震惊,赞数已经超过10万:
△ 震惊脸取样
除此之外,也有冷静的观众,想起了碧萝奶奶:
△ 如果哪天能实时拯救直播,细思恐极
我竟不知道,他们俩这么像!?
现在,考验脸盲患者的时刻到了。
你看得出是哪一刻变了脸么?
这场访谈,最初的嘉宾依然是比尔·哈德。
就在把脸转向主持人的一瞬,变成了汤姆·克鲁斯,并且是年少的样子:
△ 上为汤姆·克鲁斯,下为比尔·哈德
这只AI的一个重大优点,就是给侧颜换脸也流畅自如。许多换脸界的前辈是做不到的。
插播一个可爱的细节,比尔·哈德转脸的时候,原本说的话就是:
And then Tom Cruise walks in.
看到这浑然天成的魔法,推特评论区爆炸了:
吓屎我了,他和汤姆·克鲁斯好像啊!(稍有意译)
另外一位脸盲选手,也表示蒙蔽:
不过,这段访谈还没完。
比尔·哈德用阿汤哥的脸放飞了几秒,就不知不觉变回了自己:
注释一下,手放在嘴上的时候,已经变回来了。
这表示,有所遮挡的人脸,对AI来说也没什么压力。
而再一低眉的工夫,嘉宾又变成了赛斯·罗根,主持人已经坏掉了:
就是这个胖胖,还和周杰伦一起演过《青蜂侠》:
如果你感觉,在采访的中途变身,吓跑主持人不大合适。
那么,给电影换主角也不错啊。
告诉你个秘密,终结者是史泰龙演的:
就算一明一暗,光线剧烈变化,换脸也丝毫没有受阻。
施瓦辛格用经典尬笑,回应“换角传闻”:
△ 原来的配方
那么问题来了,是什么样的算法,造就了几乎天衣无缝的换脸神技?
DeepFaceLab
团队说,他们的成果,主要归功于DeepFaceLab这个开源项目:
https://github.com/iperov/DeepFaceLab
DeepFaceLab是Deepfakes换脸术的一个软件工具包,安装简单,使用方便,更新及时。在GitHub上已有5000多星。
代码公开是一方面。另一方面,从项目描述看,不需要太多算力就能跑。总体说来门槛很低。
03
AI换脸技术有何法律风险?
质疑个人信息会泄漏,根据ZAO用户协议内容中的必要授权协议:用户上传发布内容后,意味着同意授予ZAO及其关联公司以及ZAO用户在“全球范围内完全免费、不可撤销、永久、可转授权和可再许可的权利”,“包括但不限于可以对用户内容进行全部或部分的修改与编辑(如将短视频中的人脸或者声音换成另一个人的人脸或者声音等)以及对修改前后的用户内容进行信息网络传播以及《著作权法》规定的由著作权人享有的全部著作财产权利及邻接权利”。
该项条款包括但不限于:人脸照片、图片、视频资料等肖像资料中所含的用户或肖像权利人的肖像权,以及利用技术对其肖像进行形式改动。
微博上有网友担忧,“非法收集面部信息”“万一哪天被黑客把数据库给拿走了,你的支付宝分分钟可以被盗刷,你们自己看着吧。”
对此,韬安律师事务所首席合伙人王军在接受新浪科技采访时表示,用户本身是基于用户协议确认、同意把自己的肖像授权用于这种AI换脸技术的使用和传播,“我倒觉得这种所谓的用户隐私权不是大的问题,主要还是涉及影像本身的著作权,以及公众人物肖相权的侵权问题。”
不过,如果用户上传照片里不是自己的脸,而是别人的脸,就有可能涉嫌侵害他人的肖相权和隐私权。
虽然ZAO在用户协议里将责任归于用户,但王军认为,若真正发生法律追究,这个所谓的平台是很难免责的,所谓“技术中立”很难适用。
律师:ZAO用户协议试图责任转嫁 但法律上不一定能实现
王军告诉新浪科技,在他看来,ZAO的这个用户协议本身有诸多的试图责任转嫁、责任规避、责任豁免,或者是涉嫌违反相关法律规定的地方。
“首先,它想实现的目的是,帮用户实现明星或者影视人物角色的换脸,那么相关素材来源的合法性,以及著作权的授权,应当由用户自行解决,否则由此引发的所有法律责任是由用户自行承担的。”王军表示,也就是说,一旦有明星、版权方或者明星的肖像权利人,对于相关的换脸行为,或者换脸之后的视频传播行为,进行法律追究的话,ZAO是试图转嫁或者规避责任的。
但事实上,王军认为,如果真的有肖像权利人进行追究的话,这种内部的用户协议是无法对抗相关权利人的。因为这样的换脸行为有可能会侵害视频或者影视作品著作权,以及作品中演员的肖像权。
所以,这样的“霸王”条款表述,是无法真正在法律上豁免平台方所承担的责任的。
王军理解的正规、合规合法的商业逻辑,应该是用户取得相关视频的权利人,包括涉及到的明星肖像权利人,对于相关使用行为的授权。然后,通过技术手段进行换脸的体现和传播。
当然,获取授权确实很难,或许未来,相关视频或者短视频平台可以做一些这样的内容集合,然后对用户授权,“我觉得这个可能是从上游进行理顺的地方。”
AI换脸技术上有可取之处 应该被正当应用
其实在ZAO之前,AI换脸就曾在社交媒体上引起热议。有人将94版《射雕英雄传》里朱茵扮演的黄蓉换上了杨幂的脸,网友直呼“毫无违和”“以假乱真”,甚至调侃“老剧新拍最省成本的方式”。
当时,就有不少人担忧技术会被滥用,如果没有使用在正确的地方,将涉及版权、肖像权、安全等问题。
而早在两年前,国外技术圈就存在和流传AI换脸技术,此前也有网友将主播的脸换成明星的。不过,受多种因素限制,这一技术真正落地应用还比较少见。
正如王军所说,这种AI换脸技术在技术上有它的可取之处,有它正当应用的意义和价值。但是要真正进行相关的推广和应用的话,确实还需要考量对于其他权利方可能造成的权利的侵害,当然,相关的使用是不是构成一种合理使用,比如是否用于商业传播,就很难构成合理使用。
值得注意的是,在4月全国人大常委会审议的《民法典人格权编(草案)》里,正式加了一条:任何组织和个人不得以利用信息技术手段伪造的方式侵害他人的肖像权。
也就是说,一个好的信号是,未来AI换脸、甚至语音合成技术的应用或将受到法律管制。
“技术的发展会带来商业模式/授权模式/传播模式的变革和统合,但相关模式规则没有建立起来之前,单一利用技术自行其是的法律风险还是很大的。”王军表示。
04如何应对AI换脸带来有危害?
AI换脸技术的克星:AI虚假视频识别技术来自加州大学伯克利分校和南加州大学的研究人员在这场竞赛中暂时走在了前面。他们打造的AI识别系统,能从Deepfake制假者未注意到的面部细节入手,准确"揪出"假视频。
现在使用神经网络和深度学习伪造的视频,其质量和生产速度可能让即将到来的总统大选成为一场噩梦。但是,利用当前深度技术中被忽视的一些东西,研究人员发现了一种自动识别这些虚假视频的新方法。
DeepFake不再可怕,精准判断真伪
利用Deepfake生成视频现在还远远算不上完美。这些视频是利用互联网上抓取的海量图像库创建的,早期生成的视频分辨率一般很低(因为更容易隐藏缺陷),而且是过度压缩的。但Deepfake技术的发展速度非常惊人,而且这个过程中,不断改进生成视频中的缺陷,比如假视频中人物从不眨眼的缺陷,很快得到了改善,使这些生成的假视频变得越来越逼真可信。
早期的Deepfake生成的假视频缺陷明显,比如人物说话时从不眨眼,现在这个缺陷已被修复
假视频的生成与识别已经成为一场军备竞赛,任何一方都不会很快彻底打垮对手。不过最近,来自加州大学伯克利分校和南加州大学的研究人员在这场战斗中开发了出了新的武器,可以更加准确地识别伪造的视频。研究人员利用前总统奥巴马的现有视频,使用类似的过程来创建假视频,训练AI来寻找每个人的“软性生物识别”标签。
这听起来很复杂,其实这东西我们并不陌生。每当我们开口说话时,都会以微妙但独特的方式来移动身体,我们的头、手、眼睛甚至嘴唇都会产生这样的运动。这一切都是在潜意识里完成的,你没有意识到你的身体正在做这件事,大脑也没有立刻意识到身体其他部位的运动发生在何时,但从结果上看,这是一个目前Deepfake在创造假视频时的时候没有考虑到的因素。
在实验中,这款新的AI准确发现伪造视频的几率达到了92%,实验对象包括使用多种技术创建的假视频,以及由于视频文件被过度压缩导致图像质量下降的视频。
下一步,研究人员还打算通过识别人声的独特节奏和特征,来进一步提高AI识别假视频的成功率。但目前的实际情况是,Deepfake的发展和改进速度非常快,可能会在2020年之前迎头赶上,成功欺骗目前的AI识别工具。这可能是一场旷日持久的战斗,最终谁会获胜现在还很难讲。
图1 上面所示是来自250帧剪辑片段中的五个等距帧,显示了对OpenFace的跟踪结果。下半部分为此视频剪辑上测量的一个动作单元AU01(眉毛抬起)的程度。
我们使用开源面部行为分析工具包OpenFace2 来提取视频中的面部和头部运动。该数据库为给定视频中的每帧提供2-D和3-D面部地标位置、头部姿势、眼睛注视和面部动作单元。提取量度标准如图1所示。
表1. POI正在讲话的下载视频和段的总持续时间,以及从段中提取的段和10秒剪辑的总数。
图2.从上到下依次是原始视频,嘴唇同步Deepfake假视频、喜剧模仿视频、换脸Deepfake和木偶大师deepfake的10秒视频剪辑的五个示例帧。
图3. 希拉里·克林顿(棕色),巴拉克·奥巴马(浅灰色带框),伯尼·桑德斯(绿色),唐纳德·特朗普(橙色),伊丽莎白·沃伦(蓝色)的190-D特征的二维可视化),随机任务(粉色),以及奥巴马的Deepfake假视频(深灰色带框)
2:奥巴马视频的三种不同假阳性率(FPR)曲线下面积(AUC)和真阳性率(TPR)的总体准确度。上半部分对应于使用完整190个特征的10秒视频片段和完整视频片段的识别准确度。下半部分为于仅使用29个特征的识别准确度。
3:希拉里·克林顿,伯尼·桑德斯,唐纳德·特朗普和伊丽莎白沃伦的10秒视频剪辑的总体识别准确度
表4:对喜剧模仿假视频(黑色方块),随机人物假视频(白色方块),嘴唇同步Deepfake假视频(黑色圆圈),换脸Deepfake假视频(白色圆圈)和木偶大师Deepfake假视频(黑色菱形)的识别准确度
05
写在末尾
以“ZAO”为代表的AI换脸App,发起了对每个人的灵魂拷问:你大爷还是你大爷吗?当你看到视频里那个像你大爷的大爷,他究竟是不是你的大爷?你又该如何应对?欢迎在留言区讨论。
-End-
想看更多大咖干货文章?
请关注“技术领导力”公众号