CTO教育思想库 | 李源:用创新打破人工智能落地难魔咒
编者按
华东师大上海国际首席技术官学院CTO教育思想库系列,汇集学院教授、导师和特邀嘉宾的演讲、讲课或发表的文章,以原创思想成果与广大学员和社会公众分享。这些知识和思想成果多方位、跨领域,体现学院确立的人才培养理念,即将科技与管理结合、技术与商业化整合、“科学家精神”与“企业家精神”融合。
今天我们编发中科智云科技有限公司高级副总裁、上海国际首席技术官学院产业导师李源的公开课内容。李总于2022年5月22日在由学院主办的“华东师范大学MEM第三堂公开课暨招生说明会”上,以“用创新打破人工智能落地难的魔咒”为题进行授课。以下为内容精编。
今天很高兴给大家分享一些人工智能在具体渗透到各个行业应用时遇到的问题,以及怎么用创新的方法迎接这些挑战,破解这些问题。人工智能是很新的一项技术,在最近这十年左右得到了广泛的关注和应用,但其实这个概念已经提出来很久了。但从另外一个角度上来讲,它真正能够落地应用是最近几年的事情,所以说它是一个既“古老”又新颖的技术,在这个技术应用当中,往往会遇到各种各样的问题和挑战。我从细节的角度去看,也是人工智能当中一个很重要的分支,即机器视觉是如何在工业领域和实践中应用的,我们遇到了一些什么样的挑战,以及怎么用创新的方法去克服这些挑战。
实际上我们在落地的时候面临了五大挑战,这五大挑战都是从场景开始的。第一个挑战就是场景的迁移,因为人工智能技术也是一项软件技术,我们开发好一个软件,肯定是寄希望于它能够在多个场景中应用的,但是人工智能技术由于本身的特点,它在场景迁移上面会遇到一些挑战。第二个是场景定义模糊的挑战,就是我们到底希望人工智能来解决一个什么样的问题,这个问题能不能够被定义成人工智能能够解决的问题,这是一个挑战。第三个挑战是因为人工智能技术本身是基于统计和概率理论来的,是一个模糊的结论,那对于怎么去使用这个结论,这就有了模型精度上的挑战。第四个挑战就是我们经常希望人工智能去找出一些异常的东西来,如果异常样本是稀缺的,那怎么办?最后一个挑战就是,因为我们现在的人工智能大部分都是采用深度学习和神经网络的技术来实现的,这个深度学习和神经网络都有数量众多的参数,这些参数就需要海量的样本来进行拟合和回归,这些参数本身的数量很多,对样本的要求也就很多。我们接下来逐一展开介绍。
01
人工智能“落地难”中挑战的具体案例
在场景迁移中有一个例子,就是比如我们现在有很多根据工业需求做的场景模型,比如建筑工地或者工厂,它需要对工人的着装进行识别,找出那些没有按照要求着装的工人,因为着装其实是安全生产的一个很重要的部分。那可以开发一个这样软件,通过一些数据训练得到了一个模型,这个模型能够去识别着装。但是当我们把这个软件推向市场,就会发现有很大的问题:就是各个工厂或者各个场景对工作服的样式要求都不一样,那要怎么保证辛辛苦苦研发的一个模型,一个算法能够在所有场景下都能使用,这是一个非常大的挑战。因为工作服不一样,不可能为每一个客户都去独立研发这样一个算法,这样的话成本就非常非常的高,也就是说它只是去识别一个工作服,但是要付出很高的代价,那它的投入产出比是不划算的。这是一个场景迁移的挑战。
我们再分享一个模型精度挑战的案例。这个案例是我们去识别航空发动机,也就是涡轮发动机。它的涡轮部分一直是在高温高压下工作,即在一个金属的基底上面涂装了一些陶瓷类的、能够抗压抗高温的材料,这个材料在工作当中也有可能会被烧蚀。我们希望通过一种内窥镜的技术,就是类似于我们生活中的胃镜、肠镜之类的内窥镜技术去检查这个发动机有没有叶片烧蚀等这些问题,它检查的时候就是把这个内窥镜放到发动机内部,然后去拍摄一个30分钟的视频,再把这视频交给运行人工智能算法的服务器去分析,看在这些视频当中有没有哪个叶片被烧蚀。
这个模型我们的合作单位是自己去研发的,花了很大的功夫,花了一年多的时间,得到了一个精度很高的模型。假设它是一个99.9%精度的模型,那我们可以简单来算一下。大家可以看一下公式,假设按我们国家安防监控的最低帧率的要求——16帧每秒,我们把30分钟换算成秒的单位,乘以16帧每秒,然后再乘以它的精度99.9%,然后因为要算有没有误报,所以用1减掉99.9%。这样就可以算出来,在30分钟视频中,在99.9%这么高精度的模型下面,它仍旧有这个28张左右的误报数,就是28个识别异常。
它的应用场景是希望把所有的执行航班任务的飞机都做一次检查,找出那些有问题的,然后去把这些有问题的发动机交给维修部门去维修。那如果用这种方法去检测的话,它几乎就达不到这个目标,因为所有发动机录的这30分钟视频都会有异常。因为我们现在这个技术是没法做到百分百精度的,那这就导致看上去精度很高的这样一个模型,在落地的时候仍然没法使用,这就是我们有模型精度的一个挑战。
场景定义模糊的挑战,我也举一个例子来说明,这也是我们经常遇到的一个需求。比如我们在铁轨上面,希望用人工智能技术能够识别异物,就是不应该出现在铁轨上的东西。大家可以看到我们这个画面上异物的种类其实是很多的。从某种程度上来讲,它只是一个逻辑上的定义,它在视觉上面并不能精确地告诉我们什么样的东西叫做异物,那我们的算法和人工智能的技术是通过这个目标去识别物体的。
铁道上面有异物是一个无穷大的取值范围,各种各样的东西放到铁道上都可以称作是异物,那怎么样去应对这样的挑战呢?就是没办法精确定义,但要让人工智能去识别,这个问题就是场景定义模糊的挑战,那我们顺便也会举例去讲怎么去解决这样的挑战,即异常样本的稀缺挑战。
我再举两个案例,一个是工业上面最常用的皮带运输设备。大家可以看到就是我这个画面上红色的圆筒状的物体,这是它的一个滚轴,这个滚轴是支撑着皮带运输设备的,这个滚轴在使用过程当中可能会脱落,一旦脱落就有可能导致整个工厂发生安全事故,也有可能导致一些生产平板的故障问题。但是这种脱落并不是常态,它是一个偶发的现象,大部分情况下工厂都是正常生产的,我们也没有听说哪个工厂三天两头就会暂停生产,所以能提供给我们的样本就很少。
但是我们现在的人工智能是需要大量样本去学习、去训练的,如果从来没见过什么是脱落的滚轴,那么就无从谈起去识别这个已脱落的滚轴。这种脱落现象很少见,那就得不到这个样本,这就成了一个鸡生蛋、蛋生鸡的问题了,没有样本我训练不出模型,没有模型我也识别不出这个异常来,这就是异常样本稀缺的一个挑战。右边这张图是滑轨的磨损,同样也并不是说生产过程当中三天两头就会磨损,而是常年累月使用过后才会产生的这种磨损,那这个磨损的样本也非常非常难找。这也就需要用创新的方式去解决。
另外,我们刚才讲的场景都有一个本质上的问题——海量样本的调整。深度学习本来的优势就是有大量的参数,它可以和各种各样的函数映射,但是大量的参数就意味着大量的样本,需要大量的样本去进行训练。随便找几幅监控画面的图片,大家就可以看到从这个监控画面上采集样本是困难的。当然比如其中一个烟火的样本,大家看到地面上在冒烟,但我们也不知道因为什么原因冒烟,这个异常应该是应该能够识别到的,但它需要大量的样本去做这件事情,我们很难去抓到这种我们正好想要的样本,这就是我们海量样本的挑战。那针对这个挑战我们应该怎么办呢?
02
解决人工智能“落地难”问题的方法论思路
我提出了一个自己总结出来的方法论,就是我们怎么去做这件事情。实际上我们计算机从头到尾有很多这种类似的挑战,比如你最常用的网络。现在都是基于TCP IP来进行传输的,要在上面开发各种各样的应用,比如我们现在正在用的腾讯直播系统,还有我们的微信系统,它们都是通过这个TCP IP来传递数据的,但并不是所有的应用开发人员都需要去了解这个TCP IP。比如我不需要知道这个TCP IP的数据是怎么通过4G网络去传输的,它通过了哪些路由器,哪些交换机,这些细节他都不需要知道,他只需要知道一些API接口,然后就去开发这个应用就行了。
还有另外的,我们的应用都是运行在云计算环境上的,在云计算上我们可以很轻松的通过一些软件操作,比如网页去分配、去使用CPU,可以把CPU虚拟化。还有就是PasS——我们经常用的平台,基于云计算平台去开发,应用就变得非常非常轻松。那它们的成功对我们的启示就是逐层封装,把复杂的东西进行封装,把它变成一个我们容易使用的,并且有标准开放接口的平台。然后在这个平台上,我们就可以很轻松地去应对在实际当中可能遇到的各种各样的挑战。
举个例子,就是我们这个XP平台的一个架构,可以看到我们分成了四个层次。这四个层次分别对应着类似于PasS平台在这个结构上面,下面是一些虚拟层,包括我们的网络,我们虚拟了GPU算力,让它变成一个可以调度的任务。我们很容易去使用这些虚拟的计算能力,以及模型训练以及精度评估等等这些,把深度学习算法所需要的一切都在这个中间层去解决了,那上面就把它做成一个很容易使用的用户接口,有网页的、API的、SDK的,也有命令行的接口。
同时我们有开放的数据接入,可以接入有摄像头数据传感器的数据,比如还有一种激光雷达的数据。有了这样体系化的、平台化的支撑,帮我们把使用人工智能技术的门槛降低了,我们只需要知道这些接口,就可以去使用这些人工智能技术了。
我们刚才讲的很多都集中在样本上,其实样本的挑战不仅仅是数量的挑战。它的数量是两方面,一方面我们要采集到足够多的样本,另外一方面采用的都是监督学习的样本,这就需要人先去识别一遍,通过人的方式先去把这个样本标注出来,那就需要投入大量的人力成本进去。那有没有办法能去实现自动的标注?就是用计算机自身的能力去进行标注,而不是通过人工的方式去进行标注,同时把这个采集的过程也变成一个自动的过程,这样的话就能减少标注成本。本来它的研发成本当中其实样本标注可能占比高到60%以上,那如果把这个样本标注自动化了,就减少了样本的需求,就应对了这个样本带来的挑战。那具体怎么做呢?
03
方法论背后的具体实践
我们应该从几个方面操作。一个方面就是我们需要主动去获取样本,去找到一些最有效的样本。但是我们发现人的图像识别能力是很强的,可以通过很少的样本就可以知道怎么去识别,并且也知道哪些识别结果是对的,哪些结果是错的,哪些样本是重要的,哪些样本是不重要的。通过机器学习的方式,把它给统计出来并形成常识的知识图谱,有了这个知识图谱,把人类的图像识别常识变成我们可使用的知识图谱。我们通过这个知识图谱,对每次识别进行一个评价,那这又起到什么作用呢?就起到了可以去对识别结果是否正确做一个评价的作用。
那样本标注又怎么去用呢?我们可以用一个初始化的模型,没有什么精度可言,但是每次去识别,用常识计算可以告诉你它识别错了,那我们就不停地告诉它:哪些是对的,哪些是错的,然后它就自动进行学习。这样的话我们就形成了一个自动学习过程,极大地减少了对样本的需求。
另外,我们要用小样本去做这件事情,那怎么应用好小样本学习技术是很重要的。因为有了小样本技术的话,就不需要那么多样本了。第一性原则就是样本是挑战,数量是挑战,那我们就直接用小的样本去应对它,这就是第一性原则的一个应用。其实我们现在小样本的思路,就是想办法去进行语言学习,先去学习关于学习的学习。这个听起来有点拗口,就是通过多个学习任务去形成了一个学习器,这个学习器是非常善于学习的,相当于有很强的学习能力。打个不太恰当的比方就是,我们通过多个任务的学习,筛选出来了一个学霸,那这个学霸的学习能力肯定是比一个学渣的学习能力强很多的,那我们再通过这个学霸的学习能力去学习,那所需要的样本量自然也就降低了。
所以我们很多个人工智能的企业,更多的是通过语言学习的方式,去获取具有超强学习能力的这种学霸学习器。通过这个学霸学习器有了很好的学习能力,就可以很快地学习做东西。我给出了一个语言学习常用的求解过程,如果是计算机专业的同学,可以去看一下。其实就是定义一个low function,怎么去评估这个学习任务是学得好或者学得差,最主要的一个指标就是看这个学习能不能通过更少的样本去学习,如果能够通过,那损失函数就会相对比较低,如果不能损失函数就相对高。
还有一个就是我们经常会见到的人工智能应用是人脸识别。人脸识别的核心就是,它把一个模型应用在了人脸考勤设备里面,那这个考勤设备其实没有见过所有的人,只需要加一些底库,不需要做任何训练,也没有刚才我说的那些问题,然后它就能够去识别,那它怎么做到呢?
其实它采用了一种叫做度量学习的方式,度量学习我简单做个说明,它其实比较好理解,就是把目标的特征先提取出来,下次遇到这个目标时,就可以通过一种度量检索的方式,把这个特征和已有的特征进行比较,然后找出跟这个特征最相似的目标,就认为它是这个最相似的东西。这听上去很简单,但实际上现在也有新的学术研究发现,它跟人的快速识别物体方式相似,也就是说我们人也有这种记忆方式。因为基于记忆,只需要一些典型的样本,不需要大量的标注、人工也能达到减少样本的作用。
04
模型优化处理的必要性和可行性
刚才说的是怎么样能把这个模型训练出来,训练出来的模型还没有到应用环节。我们最终提供给客户的,或者是开发出来的应该是一个软件,而软件光有模型是不行的,光有算法也不行,还需要跟场景结合。要有很多的输出输入,可以把这些你要的资源或者要素通过一个流程图的方式连接在一起。
这有一个简单的案例,我们可以把这个目标检测模型变成一个流程,这个流程会自动把这个识别的结果剖析给一个HTTP服务,这个HTTP服务可以获取宇宙成像仪的目标检测,然后通过脚本把这两个识别的结果进行一个合并研判,最终去控制PPC,就是用摄像机去跟踪目标,去做一些自动控制。
这是我们的一个案例,我们把这个做好之后可以把它发布出来,就可以在应用上直接运行算法,也极大地帮助应对了刚才说的各种落地挑战。在不同的场景下面,不需要改代码,只需要做一些调整就可以去适应这个场景,让它能去完成这个场景的任务。
那我们看一下这个结果运行起来是什么样的?大家看到这是一个烟火识别,大家看到我们通过人工智能发现车下面有一团烟火,那我们就报警。整个过程其实就是用我们刚才说的这个业务流程去控制,然后就能做这样的一个识别。另外就是我们刚才说的各种各样的问题,不管是样本稀缺问题,还是精度问题等等,我们需要去解决它。我们采用的办法其实就是通过创新,用很多各种各样的学习方式和学习方法,这些都需要应用到工程实验当中,但是都有很多很高的门槛。
语言学习是一个独立的学科,主动学习又是一个学科。半监督或非监督等这些很新的学习思路,在学术上可能取得了很不错的效果,但是要怎么把它放到生产中来呢?那一定是需要工具的,就像刚才讲的,我们需要把这个复杂性进行封装,然后以工具的方式提供给我们的客户,让他直接能够去使用。所以说我们要采用先进的训练算法,前提是得把这些先进的训练算法工程化,并且放到某一个平台上面,让我们能够直接去使用,如果直接一个一个去做的话,其实这个投入产出比也是不高的,因为它本身也很复杂。
那我们简单介绍了一些方法,一个是语言学习,就是我们要找到最强的学霸,让学霸去学习,那所需要的样本肯定就很少了。另外一个就是可以通过主动学习去训练有效的样本,发现有效的样本,也就是说给学霸找到最好的学习教程。那这两者结合,我们就可以减少样本了。
另外我们通过这种非监督、半监督的方式,就不需要人去标注了,我们可以通过机器自动在样本里学习,只用提供教材给它,也不用告诉它教材当中哪些是对的、错的,它自己会去判别。那通过这种先进的学习方式,是能够解决我们刚才说的那些挑战的。主要解决的就是样本数量的问题,另外一个就是人工标注的问题以及精度的提升问题。
人工智能还有一大挑战,就是对算力的要求很高,并且数据一般都是基于持续数据的。例如视频类或者音频类的数据,这些数据传输占用的带宽都比较高,那怎么办呢?我们其实希望是把它放到一个云边一体的部署架构里面,希望在边缘端能做一些计算,在云端也能做一些计算,这两者结合就可以把网络传输的压力降低了。另外云端的使用成本相对来比较高,也就是把这个成本降低了。所以我们就需要有这样的一个部署体系,也就是说你开发一个应用,在做算法的时候,就得考虑这个算法怎么部署、怎么去优化。
我们也需要对这种东西进行封装,需要工具,而不是一点点自己去做,因为这个做起来是有困难的。除了刚才说的部署方式以外,我们还要逐层封装计算资源。现在训练模型是非常消耗时间的,大家可能也看过这方面的新闻,就是像open AI训练的GDP实录等这些模型,1000多亿个参数那样的大模型,用GPU集群去训练,也要训练一个月以上,那我们怎么样去使用这么大的资源呢?所以我们需要有这样的集群工具,就可以把调度变得非常简单,就是用一个容器技术封装成一个或多个emerge,然后就可以在计算集群上面运行起来,加快我们的训练速度。
回到场景模糊定义的这个问题,我们怎么去检测异物呢?我们采用了一种办法,我叫做场景绑定的办法。就是针对一个场景,你的场景中所出现的所有物体,可以把它全部定义成异物,就是不管它是什么东西都定义成异物,再通过我们自研的特殊网络,就可以区分是异物还是正常的物体。通过区分,就可以进行一个小样本的训练。我们通过这种半监督方式的主动学习方式,就解决了这个问题。我们采集3000张的样本,就可以把困难样本找出来,再找出来110张需要人工去确认,人工确认过后再进行训练,精度就提升到了79.65%,虽然不高,但是我们提升的这个幅度是很大的。我们用的样本数量其实并不多,后面我们再采集现场的样本800张,在这800张当中通过主动学习和常识计算的方式又能选出70张来进行人工确认。人工确认完之后,把所有的应用在刚才的画面上检测出来,那精度就也达到了87.32%。其实我们只用了180多张样本,针对深度学习来说这个样本数量其实是很少的,但因为我们能够快速做这种训练很少的样本,所以可以逐渐逼近异物的所有定义,这样的话我们才能够去解决这种异物检测的问题。
还有一个是我们的典型问题,这是来自于真实的需求,就是要去检测大型水混凝土浇筑过后有没有产生裂纹。在大部分情况下,通过对混凝土进行保温等的工程技术都能控制它,一般情况下是不产生裂纹的。并且这种大型混凝土浇筑场景也不是一个建筑企业每天都会遇到的,也就是这种样本量很少的场景要怎么做呢?
其实还可以采用另外一种办法,就是我们不用神经网络去识别这个异常,只给神经网络看正常的图片,然后通过一种半监督的方式,告诉它这个东西全是正常的,神经网络人工智能没见过异常的东西,当见到异常的东西时,它就会产生一个很明显和正常的东西不一样的信号。通过这样的信号我们可以知道有异常,这也是一种创新的方式。
刚才讲涡轮发动机的异常样本也很少,我们的合作方用了一年多的时间把精度做到了百分之九十八点几,阻碍他们提升精度的一个很大的原因,就是没有异常样本。他们采用了比较传统的深度学习的方式去检测异常目标,因为没有异常样本,所以他们进展得非常非常慢。那如果采用这种半监督的方式会发现提升精度快得多。这样的话我们也能够去逐渐逼近解决刚才说的发动机的那个问题。
05
训练样本优化的现实举例
再举个例子,我们去做养老院的应用,想捕捉只要老人举起双手就认为是需要帮助的场景。但实际上我们在养老院里采样是很少能采到的,因为大部分老人都还是健康的,虽然比年轻人健康情况稍微差一些,但你很难找到需要求助的场景,并去抓拍到这个样本。那我们就用了一种办法,就是专门去找这些经过训练的样本,然后我们通过这种半监督和小样本的方式训练出来,实际上就可以应用到这个场景里面去。
还有一个我们通过流程化去定义各种算法、资源匹配,去完成应用的流程图的案例。成像仪接收到检测目标,通过流程化,再用可见光去做确认,确认过后去联动、跟踪它。大家可以看到,这个是热成像(图略),这个绿色的框是我们不希望人员进入的一个区域。最后我们发现有人员进入了,在可见光的传感器上面完全看不到这个人,但是在热成像的传感器上面可以看到。热成像的问题就是看不清楚,只有温度的异常点,看不清到底是个什么东西。那我们通过这个热成像,用可见光传感器就可以确认。可见光变焦就是用热成像仪算出来焦距多少后,自动旋转对焦去跟踪它,就可以确认这个东西了。那这就说明,我们的一个应用在很多情况下要与多个传感器联合使用,并且还需要产生控制信号,那我们平台本身就可以把这一切集成在一起,通过一些简单的API就可以把事情和流程图的方式结合在一起,从而完成这项识别和应用。
从上面这个案例以及刚才讲的挑战来看,就是我们要去应对这五个挑战所采用的方式都是通过创新,那这个创新怎么来的呢?其实是通过研究计算机领域,研究如何解决这种复杂问题、解决硬件兼容性的问题,以及我们刚才讲的虚拟内存的这样一些技术。我们从这些技术中受到启发,然后对人工智能也进行了这种分层封装,最终我们的演绎就是把多种训练方法,包括小样本识别、自动标注、主动学习以及我们刚才看到的感控一体,就是从感知到控制以及多种传感器的融合技术等。我们把这些东西封装在一起,以这种平台化的方式提供出来,让我们的应用方案只需要通过PasS的方式去调用,然后去使用平台去完成应用的开发,这样的话就极大地降低了应用开发的难度。
因为降低了难度,就可以腾出更多的资源要去处理刚才面对的这些挑战。比如需要有很高的精度,可以通过各种算法相互验证,通过这种常识计算去判断这个识别是不是正确,从而减少误报,然后去解决我们刚才说的100台发动机的问题。你要从中找出有可能有问题的发动机,其实不需要99.9%的精度,而是只需要有98%的精度,就可以完成这件事情。因为每次检测我都通过常识计算引擎和交叉校验的方式去校验,识别是不是正确的,是不是能满足我的需求,如果满足不了就有办法把识别错的信息通过交叉的方式找出来,这样的话我们才能够真正判断哪台发动机需要检修,而不是仅依靠算法去做这个判断。因为算法无论怎么做,它的精度是基于概率统计的,不可能做到百分之百,那么也就没办法依靠单一算法去解决这个发动机检测的挑战。
06
人工智能落地整体思路的总结和梳理
综合起来说,我们通过应用创新的技术,并且把创新技术平台化、工具化,综合起来就可以解决我们刚才说的人工智能的这六大挑战。这里面其实每一个挑战都涉及到人工智能相关的理论和实践以及工程实践的很多内容,因为时间有限我没办法逐一展开,只能笼统概括成类似于方法论的东西。就是我们需要把这些东西平台化,从产业角度上来说,就要做一个分工:部分企业专注于场景,把场景清晰化,去定义人工智能应用的场景,去做具体的应用然后跟行业去做结合。另一部分企业需要专注于人工智能技术平台,去细化训练的方式、做更好的训练思维、样本标注方式及自动的标注方法等。
接下来我们再来看一个应用,就是刚才说的那个在美国一个铁路道口上的应用,通过我们刚才说的多光谱融合和自动控制的技术,去控制这个道口的道闸,就能防止火车来的时候有人员进入道口。听上去是比较简单的应用,但实际上是比较复杂的,因为既要感知火车有没有来,同时要感知这个人员有没有穿过这个铁轨;有夜间、白天的不同情况;有火车、汽车等不同的目标,这个目标就需要能自动切换、自动跟踪、自动去做控制且控制的精度要非常高。
为了提升精度,我们的手段是用多种传感器的融合和算法之间的交叉校验和确认来提升精度。我们通过把典型数据交给人工智能的算法,然后这个人工智能算法再去对这个目标进行识别。我们可以看到画面上(图略)识别出来,这是车、这是行人、这是远处的一辆车,这个跟我们的实际场景是能够对上的,这就是通过融合的技术去实现应用。大家可以看到这本身是很复杂的,如果要做这样的应用,可能需要很多学科的人员组成的优秀人才团队,才能去完成。所以必须把问题分成两个部分,一方面需要有平台,另一方面还需要有关注应用的人。
嘉宾简介
李源
华东师大上海国际首席技术官学院
产业导师
中科智云科技有限公司高级副总裁,长期从事图像视频相关软件的研发。曾在索尼集团从事视频相关软件研发,在深度学习、主动学习、视频处理领域拥有多项专利。
在人工智能技术研发与团队建设方面具有丰富经验。曾领导团队制定研发路线图,并且实现路线图的多个重大里程碑,负责公司大数据采集与分析平台的架构设计,完成了全球分布和自动迁移的分布式爬虫集群和数据分析平台的架构设计与实现,完成了人工智能相关的人脸识别、身份证识别、自然语言情感分析等项目的研究。
相关文章阅读
(上下滑动浏览)
华东师范大学工程管理硕士(MEM)专业学位点于2021年11月获教育部批准设立,由华东师范大学实体教学科研机构上海国际首席技术官学院负责招生和培养,为科创产业和企业、政府和公共管理部门,培养“技术+管理”交叉的中高级管理领军人才。
向上滑动
上海国际首席技术官学院
SHANGHAI INTERNATIONAL SCHOOL
OF CHIEF TECHNOLOGY OFFICER
"通过人和技术的协同转化
实现科技的社会价值"
扫码关注
获取更多资讯