查看原文
其他

如何识别网络照骗?想不想试试AI照妖镜?《追AI的人》第13期回放


🦋 AI是把双刃剑,一念成魔一念成佛
🦋 想不想试试AI照妖镜?

🦋 十八般武艺下AI安全的综合治理路在何方?

《追AI的人》第13期《AI前沿技术对抗中的”天使”与“恶魔”》邀请了IEEE 亚太区执委、人道主义科技活动委员会主席董晶老师分享。
本文为直播文字回放,全文共计14363字,完整版93页PPT获取尽在文章底部。

▼ 直播简介:
AI前沿技术对抗中的”天使”与“恶魔


董晶

中国科学院自动化研究所研究员,IEEE亚太执委;人道主义科技活动委员会主席,中国科学院青年创新促进会会员;中国人工智能学会理事;中国图象图形学学会理事、副秘书长、女工委秘书长。


框架要点


      

  • AI是把双刃剑,一念成魔一念成佛

  • AI安全“照妖镜”
  • 多媒体视觉内容鉴伪
  • 基于AI对抗的人脸深度生成伪造及鉴
  • 十八般武艺下AI安全的综合治理路在何方?


AI是把双刃剑,一念成魔一念成佛

人工智能发展的现状与影响



人工智能目前已经过了60多年的发展,大家也都知道现在不管它的理论技术,还有它的应用已经取得了一些非常重要的突破,尤其是在我国政策的支持和整个市场经济环境的支持下,目前已经成为了推动经济社会发展和推进新一轮产业革命的驱动力,也深深的影响着整个世界经济、政治、军事、社会发展的变局。


这样就是在当今的新的这样的历史时期下,新的社会形态下,人工智能的技术已经产生了4个新突破,特别是以过去大概六七年间代表的深度学习,这样的一个飞速发展的时间,人工智能的核心技术取得了一个质的突破。另外就是成为了一个新动能,在目前数字化转型期,尤其是在我国建设数字化时代这样一个数字化转型期,它为经济社会的发展提供了非常关键的使能技术。


此处提个问题!


什么是使能技术?其实因为我们叫它enabling technology,它能够作为一个通用的工具,能够去促进某一个领域或者是某一类技术的一个发展,然后成为一个新的高地。现在为什么叫人工智能是技术高地?因为大家知道我们现在世界的主要大国都在把战略人工智能作为一个战略发展的这样的一个布局,所以它其实不仅仅是一项小小的技术了对吧?它已经成为了一个战略的高度,它有高度,而且能够形成产业集群,就是高地,当然它肯定带来了很多新的挑战。



不管是从技术的维度,还是从经济的维度以及社会发展的维度,现在人工智能的技术越来越前沿,而且变化越来越快,越来越新,如火如荼的发展,就是我们已经以用4个字形容,就是势不可挡的趋势,它在飞速的发展。



回顾历史人工智能技术虽然说只有60年的发展周期,但是它其实已经作为一个代表性的革新技术,它带来了一定的社会变革,在农业社会机械化解放了人们的双手,工业社会大家使得效率提高,信息社会使得物理和网络空间上的距离缩小。智能化社会一定是带来一个新的层面上解放大家的思想,也就是一个模式上的创新行为或者说思维这样一个模式上的创新,应该是这一次智能化革命或者叫数字化革命的非常显著的特点。


◆人工智能的双面性



例子一  共享单车🚴‍♀️


很多时候我们在做技术前沿的推动,或者跟随,目标导向是非常明确。国家层面或者资本曾层面在很多关键技术布局,研发团队的部署,还有研究方向建设。这种学科领域的探索,目标设定非常重要。也许技术开发者的人员没有考虑那么多,但是有的时候这个事情是需要预则立不预则废的。


比如共享单车这个典型的应用,虽然使得人们生活非常便利,从地铁口出来扫一下二维码一块钱或者几块钱包月,就能够做到非常便利且节省时间,提高效率。但是如果说在从共享单车的技术上推陈出新到共享经济建设的这样一个过程当中,有没有一些全盘范围的思考,尤其是对于一些重要的安全问题,没有做提前预警的话,没有做提前布局的话,可能这一面技术应用就会成魔,带来许多负面影响。



比如现在一些社会大众非常关注的小朋友的人身安全,假如共享单车作为一个接送小朋友上下学的一个工具可能会带来非常大的隐患,二维码扫码的便利也会变成电子诈骗的便利渠道。



例子二  网约车




现在网约车非常便利吧,它也是屡屡上榜的有名的国内互联网的这样的共享经济的案例。例如它同样也缺少考虑一些安全的问题提前布局,优点是它很便利,省钱,节省大家的效率打车难,包括堵车的自由调度。但是如果没有考虑人身安全,国家安全或者是没有树立整体的国家安全观,这个问题可能就会直接导致整正在崛起的迈向商业帝国的公司有一个不确定性的未来



例子三  自动驾驶


自动驾驶技术的发展,不断采用高精尖的传感器,视觉系统自动导航系统等。但是面对巨大的经济价值跟经济市场驱使时,如果盲目推动和追棒最先进的车载摄像头、GPS定位系统等等,在没有考虑到一个最面向当地或者最面向市场的人性化、基础化的需求如安全的需求,就也会存在例如类似泄露隐私的隐患。



例子四  人脸深度伪造



其实人脸编辑与合成、Deepfake等技术大热起来原始初衷是它的应用能够让大家看上去更美,变化更自由,或者能够让有一些美好的回忆(比如让逝去的容颜”音容笑貌如尤在,一如往昔,但是如果心怀恶意或者没有考虑这类应用带来的安全的问题就很容易让它滥用形成诈骗利器。比如网络传言影视明星靳东结婚了,结果真靳东把假靳东告上法庭类似这样的事件很多,现在的俄乌冲突中也存在一些此类技术应用产生的虚假的舆情混淆视听,就是利用了这样的一个技术双面性。



生物识别领域密歇根州立大学资深教授—— Anli K. Jain,他有一篇文章就是介绍了”Forensices&Biometrics: Shared Goals”。他指出在研究一项技术的时候,实际上技术的本身是没有研究目标的,它是一个方法的探索。我们对一个科学领域的探索不应该是有边界的,不应该设限制,这本身是科学研究的一个很客观的现象。尽管是围绕相同的目标,它的应用场景和它本身能够带来的利用价值,和它的需求是也不一样的。


例如我们在做forensics的时,对生物特征识别比如指纹,人脸,不管它是什么使用维度的,2D还是3D,它只是一个表征,它只是一个特征,只是技术的研究对象,这些因素和功能都是共享的,研究内容和技术范畴也没有那么清晰的划分标准。但在技术应用和使用的时候,如果我们把目标明确,那么可能边界就清晰了。再如大家都提隐私保护的事情,那么隐私是如何定义的呢?在定义隐私的时候,其实隐私对于犯罪分子来说,它是不是隐私呢?对于犯罪分子来说,我们是不是不应该保护他的隐私?我们反倒是要去介入他们的隐私,让公安机关能够迅速办案。


所以我们在做任何一项研究的时候,本身技术的研究的范畴或者边界我们不应该受限,不应该有向,不应该说它是向善还是向恶,就不能片面去判断他是天使还是恶魔,而是应该对这些技术的应用有一个明确的目标导向。


◆AI发展是人类社会进步的必然产物


这个目标导向应该由什么来驱动,比如说将来要做社会治理,或者说CPI技术治理,应该首先要考虑的问题报告的核心。AI的发展是个必然的阶段性的产物,顺流而上到AI发展脉络。是由于其的科学属性,科学技术发展的规律,科学技术本身它是把双刃剑。而且现在AI太前沿了,发展的同时临时有一些目标的缺失,它是很新的东西,才会导致了目前一念成佛和成魔的这样一个治理乱象。

 

其实科学技术的发展创新和目标奔就该是造福人类,造福就是要求善。求善才是初心,初心首念中安全才是第一位。所以我个人认为AI技术的发展和治理,安全是第一位的。


AI安全“照妖镜”


◆研究背景介绍





现在人类至少70%以上的外界信息是由视觉系统所接受出一个感知的。一个世界大数据的发展模式,已经慢慢的由于基础概率模型的发展慢慢上升到了视觉认知这两个层面。

 


我们人工智能的前沿方向由于生成对抗学习的这样一个途径,模型的性能得以不断的提高。2018年它就是被麻省理工科技评论评为十大突破性的技术,它的最重要的一点是提出了一个生成模型和判别模型的这样的一个对抗博弈单元。我理解这个机理就是引用一句名人名言——“有很多东西我如果不能创造,我就不能理解”。


举一个例子,如果我们能知道它产生的过程,我们自然就能够知道它发展的过程。因为本身产生跟发展就是一个相互成长相互博弈的过程,就是对抗博弈本身是通过这个机制去做性能的协同提升,更战略层的理论,就是整个推动人工智能前沿方向发展,特别是统计模型不断往前进展的一个创举。



当下互联网大数据视觉内容的治理,安全分析的严峻形势已经使得网络空间治理、智慧治理成为了一项“卡脖子技术”,尤其是在现在国际局势大背景下,有很多前沿技术的研发是偷不来抢不来,只能是靠自己不断的研发出来的,尤其是在公安、国防、网信、工信等应用领域,技术需求是非常现实和紧迫的。


◆现状调研



在前深度时代,多媒体取证有很多的工具是依靠人工经验的。例如Photoshop就是一个很好的图象编辑的工具,也不断被利用成为图片造假的基本工具。前深度学习时代,其实我们是需要大量有经验的专家系统来做这样的事情,我们需要去对原始图像原始视频或者是原始录音的模型,或者它的原始的数字分布是做建模,然后通过模型的一些对比恢复,我们才能够去做一些像篡改视频图像的真实性完整性的分析。



但是在深度学习时代,整个模式变了,我们刚开始很难定义大数据是个什么模式,大数据是个什么模型,怎么去恢复怎么去建模。在这样一个背景下,比如说传统的这样一个图像视频伪造或者说这样一个取证需求,主要还是以计算机图形学为基础,它的技术门槛比较高,而且它主要是为了制作商业模型,所以它的很多算法或是模型它是不公开。



在大数据背景下,有很多专业的研发公司和团队,积累了大量的三维数据原型和人工经验,也作为人工干预。但是由于CV的发展,技术门槛降低了,公开源代码公开数据库公开训练模型或者参数,这也使得预训练模型变成了核心技术价值,然后这个现象也驱使人人都可以去调去试这个模型,然后不断导入不同的人工经验和优化参数,生成新的模型,再迭代这样一个模式,使得模型的进化能力越来越高,这样的一个现状。

 

在整个领域当中,其实组织技术测评竞赛是很好的技术促进形式,或者说了解这个领域现状的情况。从2017年开始,从美国的DARPA计划、NIST评测,还有类似举办的一些学科评估,技术评估的这样标准化的测试当中,能看到越来越多的团队,越来越多的这样一个科研单位对深度伪造和检测技术的需求,摆到了大众面前。从17年开始,国际上我们自己团队在本领域权威国际会议上也首次提出了一个深伪博弈的比赛,这是一个依托竞赛公开平台,不断的使用深伪算法产生测试数据,并且在这些数据的模型上去做出检测模型的博弈对抗竞赛。我们首次提出了这样的一个竞赛,今年已经是第二届了,而且我们在国内学会,还有包括在一些国际的大会上也看到了有更多的供本领域研究的测试数据集被放出来,更多的数据被产生出来共同做这项研究。



我这里也列举了一些在这个领域里面用的比较广泛的基础公开测试数据集,从08年开始往20年走,不断的为他设计新的数据库,其实很多AI算法的研究智能化程度高度依赖数据库。就像一个孩子一样,不要长大有不断的东西看,让他看的越多学的越好,越是有国际化视野越宽广的视野越好。数据库也是这样一个模式。



在针对视觉内容伪装领域做研究,我们主要需要是找差异性,也就是找在伪装现状下,我们希望能够去发现人工智能视觉系统,它是一个客观存在的系统,判别系统与人类识别系统的真伪辨识,这也做一个判别,伪装就是真伪,它实际是个认知层面的,要判别视觉真伪存在的认知特性的差异,我们在做这项研究的时候,最初衷的定的目标我们去做差异性分析,不管它是若有若无的差异性也好,比如说在做数据伪装通信的时候,我们知道有些信息隐藏或者数字水印技术应用的时候,是把一些数据藏在载体中,表观上没有区分度,但判别是看看他有没有一些其他的差异。会还有以假乱真的这样的需求,去换脸去伪造舆情,还有就是似是而非的需求,那就是做对抗做物理攻击等等。总体来说它是多阶的认知特性差异,就是找这样的差异性。



根据这样的一个目标,我们梳理出来研究内容,希望能够从多层次多角度去做取证线索的挖掘取证,也就是鉴伪也是内容可信的深度鉴别,在这样深度鉴别更重要的是网络是深度的,因为我们要做大数据分许,我们希望不仅仅做针对性case by case的,即使这也很重要,但是效率不高。我们在信号层还有它的内容层以及语音层去找认知的差异性,认知差异性也就是不一致性,做不一致性度量,做概率分析,从各种层面上去做感知特性的差异。


◆研究目标



所以在我们整个的研究的目标当中,希望针对视觉大数据,通过自然图像的统计结构分析,通过它整个数据在物理空间成像当中,它固有的一些约束,比如我们知道客观世界存在的一些前提条件和约束,不断去融合,我们去做它的建模分析。


另外在语义空间在认知层面上,因为机器的层面它可能在物理空间建模我们会模仿得很好,但是在认知层面我们本身然后这种对脑认知这一块,其实很多前沿技术还是是没有定论的一些模型,我们没有办法去做,那在语义上我们能做的参考的模型,希望能在语义层中能够把它工程化实现出来,所以根据像素层物理层和认知层的不一致性去建模数据库去累积这些常识,去做这种客观约束的这样一个规则的制定。


多媒体视觉内容鉴伪


◆信号层可信鉴伪分析



在信号层分析方面,这里主要是跟大家讲的特征需求,那就是在信号层,我们其实希望在造假指纹的发掘或者检测上我们怎么去找这样一个模型,就是我们怎么去在。其实在深度网络或者是说在做模型的鉴别当中,或者是说特征分析的时候,实际上我们更多的是要去找边界,做统计特征模型的分布,反正我们能够学到这两类模型统计分布上的一个差异性或者分布的边界,我们其实是很轻松能够去做一些简单的边界化,从而做出分类判别。


信号层我们对模型的鉴伪的分析问题其实很简单,就是做造假痕迹(算法)的造假指纹分析,当时做这个工作的时候,仅仅是选择了三类代表性的图像数据库来训练造假指纹库,这个图像库我们一定要有差异性,在做模型或者做分类鉴别时,三类模型的选择图像本身是代表性的,所以我们当时选择了三类不同的深度伪造的模型去做类别的,实际上我们的训练对图像认定支撑图像还有真实图像的边界,我们去学它的这个差异性信号,也就是说它在数据真伪的统计特征模型上,因为本身他俩图像就是长得很像的,所以我们最终是用高通滤波器去除了图像里面的内容,用噪声图层去做这样一个建模,然后基于典型的GAN网络结构,就能很好的去刻画概率分布。



目前这个差异最重要的是我们在参数选择上是用是实际数据训练分类界面,因为我们能够去设置它的内间距离和距离的一个分类的目标,就能够学到这个内容是什么差异性,使得我们最后只能分析一个模型,大家只能它到底是用哪一类具备的算法去做这样的一个这种图像的生成或者是邻域图像的生成,我们得到它的一个分类界面,就是在我可以看到右下角,我们把它的统计分布很好的区分出来,它就针对这个情况。


在训练模型的时候,我们在训练数据的时候一定要有差异性考虑到这几类图像或者说对应算法之间本身的差异性,不然如果它本身就是同一类模型的一个迭代,会呈现同样模式的决定模式,如果过学习是很难能够检测出来的。



我们在早期对篡改的图像是基于JPEG的量化效应压缩,就是我们有图像,比如我在做篡改的时候,我们考虑到的一个常规操作就是这个图像,如果我做了篡改图之后,我还会把它压回去,那么在这个操作当中,肯定会有两次量化压缩的存在操作。

 


实际上我们不是在做区域的伪造检测,而是在做量化操作的检测---两次量化产生的压缩因子差异性检测。这里说的差异性分析,具体是通过一个图分割的方法,很好的学到边界效应,使得篡改后图像存在的量化效应都会被放大,然后我们就能找到响应的统计的区域,我们也做了一些实验证明这个方法的有效性。



后续我们还根据实例,我们做了一些篡改区域定位的工作。


◆场景层可信鉴伪取证



 

信号层,也是我们本身让图像本身的一些信号或者图像本身,由于它的内容表征在像素层的一些固有的特性或者固有的属性,给我们提供了一些伪造痕迹可信的分析的线索。我们的需求是在找伪造线索,我已经理解了图像本身在成像的过程当中它是怎么样拍摄出来的,鉴伪相当于是恢复出伪造的过程,然后在这逆过程当中我就能找到线索。


在场景上由于存在成像约束,光照这个客观现象造成图像本身在光照亮度投影方向上或者说这个维度上具有篡改差异性,我们去分析这个问题的时候,其实更多的考虑到了更加广泛的人为因素观察,不仅仅考虑图像层面上的生成原理,而且考虑图像本身固有约束带来的新的规则。


成像场景当中,比如说我在拍摄图像当中我已经有自然光,我在考虑如果是篡改图像当中这两个自然光的方向可能就不会是一致的。其实逻辑上一定要有做这样的一个操作它是可信的,它是能够给大家带来分析价值的,也许这个方法在特定的环境下是有用的,但某些环境下是不有用的,但是只要这个方法能够带来价值,我觉得这个方法本身的可能性我们是应该去了解到它的应用边界的。

 

下面这个工作主要是在对图像的三维光照的环境去做估计,估计三维光照在整脸的这样的一个皮肤区域,在某一个区域就是我们对三维人脸建模的应用,然后对这个模型去做它的一个光照的估计它的法向量去看,lighting是在哪个地方集中的最多,然后我们恢复出来它的光照方向的一个极大值,极大值之后去判断两个不同的区域恢复出来的方向是不是一致的,作为一个判断准则。



我们也做了很多的实验,在不同的人脸自然模型上,还包括不同的光照环境下进行的渲染下,我们都做了一些实验,这个实验结果给我们带来了很多参考的价值。



这个工作是围绕人脸场景层鉴伪的透视失真分析的方法,就是主要利用了我们在透视失真效应检测的,它利用我们了解摄像机成像的时候,如果因为摄像机本身它是在成效过程当中它是有透视失真的,并且透视失真其实在不同的距离当中,它的失真效益是不一样的,这是一个基本原则,也是大家知道摄像机本身成像原理当中有这样的原则,我们利用这个原则在图像层次去恢复,基于关键点的进行检测,我们只要是恢复出这个情况下的失真效应,能够准确的恢复出来,然后并且判断出来如果这两个数据恢复出来就是不一样的,就判断出来他可能是具有翻拍的操作。


 

基于另外一个观察,是基于前几年有一个比较热门悬浮角事件。我们突然想到这个一般情况下,脚本身它为什么会悬浮,这应该是站在地面上的,脚站在地面上是一个常识,或者说是这样一个基本认知,使得我们后续的工作就是我们去对不同的鞋做模型,尤其是平底鞋的模型的具体建模分析,然后我们从模型上去恢复鞋底和地面的法向量的一致性,鞋底跟地面是在同一个平面上的这样一个常识,我们基于这样的常识,去做这个数字建模,三维模型跟法向量的模型的方向如果不一致就把它是否是假的图像区分出来。



我们针对互联网的图像实例能得到一个很好的测试结果,比如说这个算法测试的结果是我们只要能够找到地面模型的法向量,也是只要我们能够准确的恢复出来地面的法向量和模型的法向量,这个方法的可用性是非常高的,并且我们在网上也找到一些实际的图像样例测试,不是我们实验室数据里面自己造的,就是网上的真实案例,确实是能够找得到一个很好的就是这种平面底部的约束,是作为一个很好的评价标准。


 ◆语义层可信鉴伪取证




其次我们在语义层上其实也有一些约束作为差异性分析的依据,比如说这个例子我们其实是做了一个线索关联跟知识图谱搭建的工作,这个工作主要还是根据一个知识图谱的构建,也就是比如说我们知道图像语义的常识“猫或者说大象是不能浮在天上的,或者说猫它一般情况下是爬在地板上”等等,我们去构建这样的一个视觉目标语义规则库,我们把构建的规则库作为一个引导,作为一个就是模型学习的这样一个基本的这种它常识网络,然后在常识网络当中我们去构建这种分析它取证的分析工作。如果说个性化就是不构建出来,跟我们的常识是违背的,也就是违背了现实规律,可以作为鉴伪的依据。



我们还有一个代表性的工作,是围绕这种视频的人脸的生理信号分析。虽然我们知道相机生成的图像一般它是不具有人类的生理指征,但是正常人在视频当中出现,其实无论或多或少,其实是有正常人的这种生命迹象的,摄像机特别是高清摄像机才能捕捉到这一点,一些低质量成像的摄像机可能捕捉的不好,只是精度问题,这个事实是存在的。


然后在我们就是用一种微弱信号的提取技术,并且是周期信号的这种提取的方式,我们去恢复视频中的人脸模型,去恢复在额头区域,鼻子区域以及嘴巴区域的一些关键点的变化,因为由于心血管的压缩跟舒张其实会带来关键点在视频信号当中的一个轻微的抖动,抖动的差异性,其实我们可以做周期信号的提取,然后把这个周期信号提取来作为这一个上面提到指征的统计。



特征分析如果是周期性的,并且符合一定的标准,我们就认为它是真的,如果不是我认为它是假的,我们设定的阈值,并且我们把这样的一个工作不仅从心跳这样的一个识别,就是说在这个视频信号当中我们去做一个心跳检测,我们也在呼吸频率分析、扎眼眼动分析,还包括一些微表情等等这些领域都把这个技术去用上了,而且发现在很多理想的情况下和现实情况下,他都能够得到一些很好的这样的一个判别的标准的建立。并且我们在深度伪造检测视频当中,也用了这样的一个分析方法并发现它非常实用。


         AI对抗的人脸深度生成伪造及鉴伪



这一部分的工作其实更多的是从技术本身,就是特别是对前沿技术的当中我们去做的一些研究,基于AI对抗的人脸全程等效及的一个基本思想,我们在做一些工作的时候,我们去做一些模型上的一个对抗防御,我们了解到了这个模型,其实要主动的去让模型去学习,或者是主动的向模型去作为自主博弈或自主对抗的可迭代可叠加的一个进程。

 

那么去把主动的挖掘检测系统其实可能遇到的一些弱点,以防止有刚才我提到已经能够作为很好的正确的情况下,我去攻击你,我知道你防御手段了之后,防止别有用心的一些人去做这样的事情,因为我们把整个挖掘检测系统的一个弱点,其实是作为一个AI对抗研究的核心方向。



在这个工作当中,我们在挖掘检测系统的弱点的过程当中,我们其实是希望把整个学习过程作为一个全阶段学习都是合格的这样一个对抗的对抗的手段,使得在人类伪造对抗攻击当中,我们对这个模型能够量化的去评判,能够在不同的也在不同的强度,不同的攻击的类型当中上,我们作为一个相对来说比较比较全面的类型。

 


在人脸属性编辑方面,在比如在做人脸伪装的时候,应用的时候有时候是把人脸换掉了ID,把它的整个的身份去替换掉,或者把身份去隐藏掉,目的只是加大它的伪装力度,看能不能够做识别。


我们的工作其实是发表在人脸属性编辑上,我们的目标其实是想做精细化的人脸伪装能不能够影响鉴伪,就在我们这个项目当中其实是有不同的应用导向性。在妆容迁移上我们利用的思想是希望利用的UV空间、人脸的三维模型的UV空间的对称性,使得我们生成的妆容能够更加美观,更加细节化。因为人脸认为空间在在这种场景下它是具有一个完备性的,那么因为空间的属性是很完备的,在美妆的时候,比如在做人脸妆容迁移的时候,在遮挡情况下,或者是在有阴影的情况下,其实它的照片的效果是特别不好的。

 


我们的目标是想知道在某些区域的隐藏,或者是在某个区域的对抗中心能够没有效果,在人脸刚才这个工作其实我们后面开发的系统就是在物理攻击上,我们是做了一个口罩,这是这样一个打印的口罩。



我们针对不同人脸之间的一些属性的类型是一致性的,但是它各个属性的布局的形状它又是不一致的这样一个问题,我们想要实现的是任意人员的人脸操控,就是不需要特定人物,也不需要随机变量的映射,利用关键点提取、几何形变和混合特征融合等方法做到高精度人脸编辑。

 


人脸生成或者说是操控这一领域,主要是深度模型的应用目标,就是在基础研究的目标上,我们其实不仅仅是做正向的工作,就是刚才说到的这个是做视频生成,不仅是做视频伪造检测,我们还是做生成方法而不是检测方法,因为我们只有了解到现在最新的这些方法和最好的一些方法,在效率上,在时间成本上,在代价上的模型收入成本上,它有些什么样的共性,有些什么样的特点,才能够更好的做反制技术,我们提出的像这种一系列人脸表情重演框架,根据身份不一致性来做换脸的这个目标,或者是营造的这种id保持等等这些工作,我们最后在正向技术的研究经验对于后续实践做检测的效果,都对整个项目非常有帮助。




前期的工作我们主要是围绕人脸来进行,现在因为更多的这样技术发展其实是围绕在人体图像整体来进行的,就这两年我们在人像这种人体生成模型的这种法理上面有一些工作推出,原来的工作是从监督学习出发,对这些图像生成精度上,姿势保持上的生成效果分析。我们利用了一种能够刻画不同姿势之间的这样一个配准方法,我们很好的保持不同的人体部件当中的一个一致性的匹配关系,所以在这个模型很简单,我们保持映射关系的情况下,去做生成才能够达到更高的精度,能达到更好的效果。



最近我们课题组也在人脸匿名方面做了一些尝试,整个工作的主要的目标是能够做到一个可控的,并且是连续的这样一个人脸身份的属性迁移,能够在生成一个目标图像的基础上,使得 ID属性能够很好的迁移并在一定隐射范围内有条件调节。



模型的映射可以做到在身份表示空间具备了一个可调可控的德尔塔抖动的范围中,它能够做到身份信息的去除,并且能够使得生成效果保持非常良好,然后达到一个高分辨率的生成试验结果。



围绕对抗样本的迁移性研究,我们在这个模型当中其实最重要的是希望能够提出一种新的攻击方法,证明这种攻击是存在的,并且这种方法能够很好的去攻击我们的对抗样本做到防御效果。



以上工作的简要总结如下,我们研究的思路是第一我们要使得我们在做鉴伪这件事情它是可解释的,我们做的评判标准我有依据,我们从各个层面上能做一个分析,我们有依据可以拿得出来。


第二就是我们在做新的防御性的技术研究的时候,我们整个课题组的研究或者说布局,我其实也是正反两面,不管是成魔还是成佛,我们两条腿一起走在相关应用当中,我们不仅仅要做正向,不仅要去做这样的生成,我们也要去做鉴别,既做防御又做反制,两个这样的目标才能够达到我们将来整个应用的系统和示范领域,能够真正的服务国家安全公共安全和网信监管。



所以在整个领域当中,由于我们模型公开、算法公开数据公开的这样参数组学习的这样一个现状,我们针对性的一些积累算法的效果是比较好,什么叫针对性?就是在特定环境下,针对某一种特殊的算法或者是特定人物的,知己知彼的这种情况下,鉴伪效果是很良好的,但是由于我们认为我们只是工具的使用者,我们只是搬砖人,我们并不是在学术上去说去提出了一个新的学科,我们只是在提供一些思想的,然后并且把这个事项实现出来,他的学术研究的价值领域相对来说没有那么大,但是它的意义是很重大的。


所以在整个领域当中现在是刚刚起步或者说已经走在路上的这么一个阶段,但是它的难点和它的挑战是非常明显,也就是说它的通用取证的识别方法,我只能说是可行的意思来说只是有希望,现在可能不好用或者说不准确,这是很正常的。


希望能够达到一个百家争鸣,百花齐放的状态,才能够让更多的人了解,更多的人认可这项工作的意义。并且它如果用的更多,其实对我们的防御技术,或者是对我们对抗的技术来说,其实是一个更加促进的,这就是我们说到的,其实在博弈的路上,我们是希望能够矛跟盾一起发展的。



中西方在这个领域,特别是现在的这种特殊历史时期下,就是独立条件下,我们在人才的技术在生态在市场方面的竞争愈演愈烈,我们在不断的希望能够引领,希望能够走在更前面,希望能够更快更好的去发展,包括我们面临的这些隐私的问题。


 十八般武艺下AI安全的综合治理路在何方?


我从08年开始在IEEE(美国电气电子工程师协会)国际学术组织,也是信息领域最大的国际学会担任学生志愿者,我从08年在IEEE的国际会议上发表我的第一篇学术文章,在后来加入这个组织做一些志愿者的这种服务工作,IEEE其实对我的科研促进挺大的,因为毕竟产学研用不分家的互相促进的,综合的这种前沿交叉领域的平台资源和经验累计其实能够促进,有很多的过来人也向大家证明过,交叉融合其实对科技创新是非常重要的一部分。


在IEEE 亚太区担任执委期间,我其实担任过很多角色,早期学生活动服务委员会委员,也担任过女工程师协会亚太区的主席,也是中国首个青年女性,我也非常高兴在这里面认识了很多国际友人,也交流了很多,他们曾提到特别是在前沿技术的综合应用和治理方面,因我从2019年开始担任IEEE R10 Humanitarian Technology Activities Committee Chair, 其实中文直译叫人道主义科技活动委员会,但是实际上在内部他们更多的是希望它是叫可持续发展技术委员会,可持续发展是它的一个主要目标,它的可持续发展实际上就是联合国的可持续发展目标。


这个目标有17个,我后面有一个中文的全球发展目标翻译版,它的整个的应用的前景其实就是在做人道主义,可以看到里面提到的消除贫穷,消除饥饿,优质的教育,性别平等,清洁的饮用水,还有经济适用的能源等等,后面的一些这里面有很多的目标,其实更多的是面向国际社会最基本的需求,最基础的技术应用需求。


来!看一个案例


可持续发展的技术理念的案例:如果说现在有一个落后地区,或者说一个他要做一些人道主义科技投入,例如我们要帮助一个山沟沟里离学校往返几十公里的孩子们去镇上上学,怎么做呢? 会有人说我给他捐钱建学校或者买校车送去,我让小学生能够走出山区去上学,然后有人我们说我们也配一个师资配套,让他在那里给大家教书,那他们的文化水平就提高了。但是实际上最后我们讨论出来这是一个不太可行的方案。我们是有很多的资金,我们是有人员的投入,可是它可不可持续?


这个钱捐过去了,但是那里有钱也买不到东西怎么办?车子捐过去了,这个老师派过去了离开了怎么办,或者说车子没有油了,车子维修,汽车的更新迭代怎么办? 考虑一下后面可持续发展的事情,比如大车如果坏了谁来修,这个车如果说坐不下了,小朋友今天或者以后就不能上学了,或者车坐不下了怎么办,一系列后续管理难的问题。


后来大家讨论出来的方案是我们其实应该就派一个人就好了,派一个什么人?派一个工程师,派一个懂得当地情况或者说至少是说知道当地能够良好沟通的这样一种技术实现能力的这样一工程师,去告诉他将汽车技术本地化的这个东西,我怎么样去制造一个能够让他们走到或者说方便快捷的达到一个地点去阅读、去上课或者是做教育培训的这样的一个便捷的工具。


然后就是他们在制造的这个工具,我右下角放的这样一个车子,是一些废旧的车皮和自行车的改造成品。使得他们在动手参与这件事情的过程当中被教育,而使得他们被教育了之后,能够让更多的人参与到这个项目当中,并且在这个项目里面一起来走出山区,能够更好的往返山区,并且不断的带出一代又一代的,这还没有成本也好,或者是说污染问题等等。


本质上最重要的目标是最基础的需求,你就是面向当地最重要的一个需求,并且是最重要群体的这样一个实际需求,这个也是符合我们国际上像马斯洛这样的一个需求分析的model,成本越高,对认知层面的对认知层面的这样一个需求,其实是成本越高影响越小。然后最基础的需求其实最重要是安全的需求,刚才提到的这一类的需求。


还有CT的一些需求,还有老年需求的资金财产的需求等等,这些需求可能更基础,更加的怎么说,不能叫人性化更加基础,我们可能要首先考虑这些,因为技术的发展应该首先把这些漏洞给堵上,或者说把这些需求给考虑到。就说实施的需求或者实施这项技术,也许只是借鉴,也许只是集成创新,也许是原始创新,它能够带来这个地区整个水平的提高就是很好的需求。


另外就是最重要的一点,我们希望说越智慧的或者是越smart的 technology,越需要有一个更加有全局观,更加有科技发展观的这样的smart developer。也就是说最终我们其实要有更优秀更有眼光的developer,而不仅仅是把技术去引出门。



比如在微软公司,他们在AI伦理或者AI治理方面,它其实有6个原则,这个原则是公平,安全可靠、隐私保障、包容、透明度、负责任,整整更多的还是面向基础的需求,在公司他们的这种产品设计,它首先是推进社会组织的基本认知。另外比如把一些安全创新对公众负责,建设这些所有高标准等等这些他们在开发开发的城市原则,需要的一些基本的原则。



在国家科技创新的路程上,国际合作国际科技教育合作是非常必要的,但是从我们科研国家队的导向基础上,我们其实是需要站在一个更高的高度,其实IEEE有很多的思想和理念,我们还是应该跟从的,然后给大家介绍它是如何推动或者是驱动科技创新的,就是说实际上它是有“组织有预谋的,有一个良好的生态”。



学术生态的搭建通过会员活动平台是非常重要的,大家如果不活动不交流不进行的研讨,不交流思想,这个技术创新是没有发展前景的,另外就是要有规范,也要有一个高标准就是目标,并且有一个手段就全程协助,最重要的目标是我们要放眼国际化视野。


在整个IEEE可持续发展(人道主义科技活动)委员会制定的国际战略协作,或者说战略规划和策划上,与联合国可持续发展目标与IEEE的愿景是一致的。因为只有在高度一致的基础上,大家其实效率是最高。



AI的安全的综合治理其实落在何方,我们可以参考上述提到的这些观点,志存高远、脚踏实地。另外就是全球的AI治理,其实国内国外发展已经开始同频了,不管是为什么现在对抗环境和压力这么严重,因为咱们现在的AI 技术还是应用的挺好,我们在技术应用方面确确实实很先进,而且社会大众已经受益了,将来还要更受益。



🎁文末福利🎁

这个五一,大家尽量减少出行,不给国家添乱

AAIG为你设计了一套

五一宅在家-德智体美全面提升方案!


大家不仅可以和志同道合的伙伴进行同频交流,参与有奖竞答,收获干货满满的知识礼包......

更将获得AAIG为热爱运动的“刘畊宏男孩女孩”准备的德智体美全面发展的礼品包👇



让大家在五一假期“以学促思,以思促行”,在学习和运动中凝聚“心”力量,把握新方向💪

具体玩法规则介绍,请看本次推送第二篇文章~


扫码发送:PPT 93页董老师PPT原件一键下载!

追AI的人 往期推荐点击标题查看文章

AI模型版权保护的攻防战:基于测试的版权保护框架DeepJudge—《追AI的人》第11期回放



沙盒监管?隐私计算?聊聊多方协同的AI治理模式—《追AI的人》第10期回放



让AI更有益思!一文读懂人工智能训练师: 被国家认可的新职业—《追AI的人》第9期



硬核前沿!万字厘清因果推理融入机器学习:浙大况琨—《追AI的人》第8期直播回放



36万人关注的AI治理互交栏目—《追AI的人》年终总结~我们一起向阳成长


这个AI不太冷 往期推荐点击标题查看文章

“算法偏见”是概念炒作吗?「这个AI不太冷」第3期带你揭秘现实AI!



你会和虚拟人谈恋爱吗?「这个AI不太冷」第2期带你了解现实、应用中的虚拟人!



"人工智障",是算法翻车还是人翻车?跨界科普栏目「这个AI不太冷」第1季上线咯!


更多人工智能治理和可持续发展好文点击下方名片关注和星标
【阿里巴巴人工智能治理与可持续发展研究中心】👇AAIG课代表,获取最新动态就找她

 关注公众号发现更多干货

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存