查看原文
其他

让AI更有益思!一文读懂人工智能训练师: 被国家认可的新职业—《追AI的人》第9期回放




🌟 人工智能训练师到底为AI在各产业深度落地过程中的定位是什么?

🌟 标准在人工智能训练师的孵化和发展过程中又发挥了怎样的作用?

🌟 现在人工智能训练师和未来发展前景如何?


本文为《追AI的人》第9期《人工智能训练师标准与技术展望——AI职业技能标准构建新职业生态》直播文字回放。


阿里巴巴集团标准化部和达摩院专家探究人工智能训练师的昨天、今天、明天!全文共计8688字。

🔻直播简介:

《给AI当老师?人工智能训练师让AI更通"人性"!《追AI的人》第9期来咯!》




赵霁飞

阿里巴巴集团标准化部高级标准化工程师。悉尼大学硕士,10年深耕国际、国家、行业等标准化推动经验,ISO国际标准注册专家,聚焦电商、双碳、职业技能等标准领域,主导和参与国际、国家、行业、团体标准50余项。


吴东恒

阿里达摩院解决方案架构师。人工智能训练师国家新职业申报人及国家职业技能标准起草专家。目前聚焦于AI创新业务产业化落地。




框架要点

1
人工智能训练师的前世今生
人工智能最初可以追溯到1964年首台聊天机器人诞生。美国麻省理工学院AI实验室的约瑟夫·魏岑鲍姆教授开发了ELIZA聊天机器人,实现了计算机与人通过文本来交流。ALICE是一个开源的机器人,最初由理查德·华莱士(Richard Wallace)写成,随后有500多名志愿者为这个机器人做出了贡献,他们为ALICE创造出了10万多条AIML(人工智能标记语言)。


在对抗机器人这一块,最早应用于国际象棋领域,“深蓝”就战胜了当时国际象棋世界冠军卡斯帕罗夫、23年后,“AlphaGo”也战胜了围棋的世界冠军李世石。事实上,在对抗机器人刚出来时,它是完全达不到人类的竞技水平的,只会简单的规则。但经过大量的实际场景的棋谱作为训练样本的加入,加上算法、测试的不断优化和创新,人工智能的实战便达到了人类的顶峰甚至成为人类学习的对象。


完全利用历史积累的数据创造出来的人工智能产品,它的“智商”大概相当于一个五六岁的小孩,这样的产品放在任何一个领域都是不能用的。现在许多行业在应用人工智能产品的时候都挑选了一批熟悉该行业领域业务的人,让他们每天跟人工智能产品进行“互动”、帮它“纠错”、也“传授”新的知识

早在2018年,阿里便宣布要培育10万个机器人“饲养员”。人工智能训练师在当时这还没有明确的定义,而后才逐步提出人工智能训练师的概念,一些国内外的招聘网上也逐渐出现相关的招聘信息。


那么怎样才可以称作是人工智能训练师呢?

· 标注和加工业务的原始数据(图片、文字、语音等),使之符合人工智能算法建模规范;· 跟踪人工智能产品效果数据,对人工智能产品的配置进行针对性优化;· 挖掘行业特征场景,训练和评测人工智能产品相关算法和功能的性能;· 结合行业特点,针对性设计人工智能产品的交互流程和应用解决方案;· 针对人工智能产品的应用效果,从顶层起重新思考和设计新一代人机结合的组织架构。

对于人工智能进行标注、优化、训练、设计、架构的人员均可以称之为人工智能训练师。


2
人工智能训练的应用场景和产品
在AI产业落地的领域中,我们常常会被问到一个很核心的问题—— AI技术的应用到底会不会把我们给替代掉?


如图,我们写了一个标题叫做新常态、新使命。这里我们其实是要回答一个问题——人工智能技术的应用后的这几年,到底是增加了就业还是减少了就业?

目前市场有两个论断:一个是觉得人工智能技术创造了更多的就业机会,一个是觉得算法取代了很多的就业岗位。通过集团内部以及发展研究基金会这样的一些第三方的机构,我们做了很多的调研,调研结果如下:

人工智能技术应用后,仅有少数的商家出现了用技术替代人工的情况目前绝大部分的人员在人工智能训练师培养体系的帮助下能力得到转型与升级,转岗到了人工智能训练师的岗位上来。

人工智能训练师的诞生最初起源于一个叫AI Trainer的角色。这个角色的话诞生于2015年,它的诞生也令我们倍感自豪。在过去的几十年里,无论是新诞生的岗位也好,还是互联网创新也好,国内一般都是跟随着国外的脚步在走。而在这样一个时候,阿里巴巴以及行业内的很多人员一起提出来的人工智能训练师的岗位就显得尤为珍贵。

从2015年到2018年,人工智能训练师处于一个蓬勃发展的时期。这时也出现了非常多的报道,包括人民网、新华网、央视等等,纷纷开始了对于人工智能训练师的报道。


2020年初,新冠疫情突然袭来,对医疗机构和医生造成巨大压力。大量的患者去到了医院里面,急需通过CT诊断去判断出来是否是得了新冠肺炎。在这时,达摩院的AI医疗团队推出CT影像新冠肺炎AI辅助诊断系统,去帮助医疗机构和医生筛查和诊断新冠肺炎患者。


关于CT影像新冠肺炎AI辅助诊断系统很核心的一点在于,算法工程师并没有足够的医疗知识储备,如何研发出符合当时医疗情境的诊断系统?这个时候就需要有专业的数据训练师,专门用进行数据训练。

关于人工智能训练师的需要做什么?比较初级的工作就是将数据通过标注的方式圈出,确定以后的话,构建相应的模型去做训练。但是很明显,仍然会有一些数据没有识别到,训练师就需要去标记这些bad case。并且,更高阶的训练师,会跟算法工程师一起去分析和定位模型没有识别出的原因,对模型进行优化。

在这样的紧密配合之后,CT影像新冠肺炎AI辅助诊断系统能够在20秒内准确地对新冠疑似病例CT影像做出诊断,准确率达到96%以上。所以从这方面来说,新的技术也诞生了新的职业。

3
人工智能训练师的标准及认证
本章内容主要介绍人工智能训练师的认证标准以及落地应用的情况。

能够成为一个新职业,它必须有充足的人员基础。通常而言,新诞生的职业在岗人群至少要达到几十万的量级,而且有着逐渐扩大的态势,国家才会去认可它成为一个新职业。而人工智能训练师经过数年的孵化和发展逐步走向成熟,都符合这些条件。


关于人工智能训练师,人力资源社会保障部办公厅等机构给到了定义:使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员。

从上图的主要工作任务中,我们可以发现人工智能训练师包含但不限于数据标注员和人工智能算法测试员,在未来的发展过程中还可能会裂变出一些新的工种,谁也不知道它究竟会往哪个方向发展。就像很多互联网催生出的一些行业,如互联网营销师等,看似包罗万象,实际上直播销售员也是它的工种岗位分支之一。

因此,国家的职业认可其实和我们的生活其实息息相关,也和新技术以及新的应用场景紧密联系。国家对于新职业的认可,也给到了从事这类岗位的人们以身份认同感。


正式颁布新职业以及技能标准之前,有一个专门的标准制定流程。如图我们看到,2019年4月份我们正式向国家人社部提出申请,12月份正式获批并开始国家职业标准的制定。

职业标准用于确定这个职业具体是做什么以及怎么去做。如茶艺师、厨师、电焊工等,每个职业都要有相应的标准来规范,各个职业的各个等级是怎么样的,职业的具体职责是什么,怎么区分高低阶水平,都需要有明确规定。

秉持着整体性、等级性、规范性、实用性、可操作性的原则,行业内的相关方也都一起加入到了人工智能训练师的标准制定过程中来。到标准最终发布出来,差不多历时两年的时间。标准反映了国家人社部对于该职业的要求,制定出来后需要确保它能满足行业发展实际需要,同时也能够反映真实的职业上升通路。


上图为公开的标准内容细节,其中包括职业名称、职业编码以及相应的技能要求权重。从初级工到高级技师,有着6大维度的要求,包括数据采集和处理、数据标注、智能系统运维、业务分析、智能训练、智能系统设计以及培训与指导。从中我们可以得知,在职业要求权重中初级工到高级技术的侧重点不同,并不是级别越高所要求的范围就越广,这与我们的普遍认知其实有所区分。


然后我们说说职业技能等级认定的过程。职业技能等级认证伴随着政策而进行发展和过渡,并非是完全固化的

目前的职业资格等级证书,一般由国家人社部以及地方人社厅下的职业技能鉴定机构颁发。在未来,职业技能等级认定可能会逐步扩大整个的职业技能等级认定机构的范围。届时有资质的第三方甚至企业也可以在国家人社部拿到相应资质,向全社会发放职业技能等级证书。这也是职业技能等级认定的一个新的政策趋势。


职业等级认证有何作用呢?如图所示,入户积分、技能提升补贴、子女积分入学、个人所得税抵扣以及高级的人才晋升等等,都是职业技能等级证书带来的显性收益。跟过往的职业资格等级证书类似,国家各地方对各类人才都有相应的鼓励机制,用于鼓励人才的引进。


对于人工智能训练师的职业以及相关业务,阿里也持续在做一些促就业和公益活动。

2019年,阿里在河南光山做了一个叫做数字就业扶贫基地的项目。在过往,河南光山的贫困县中有许多人因为各种各样的原因不能离开本地,只能靠微薄的收入维持生存。这个项目就是通过建立一些基础设施让贫困户参与到人工智能培训师的工作当中,经过简单的培训,他们在家门口就能获得一份体面的工作,并且获得不错的报酬和实现自身的价值。

支付宝公益基金会、阿里巴巴人工智能实验室联合中国妇女发展基金会启动了“AI豆(谐音‘爱豆’)计划”,通过提供免费职业培训,让贫困群众尤其是女性成为“人工智能训练师”,在家门口实现就业脱贫。这个活动更多针对留守妇女,这类的人群往往都有小孩,这些岗位使得他们能够同时兼顾到家庭。

不管是脱贫也好,促进就业也好,还是公益也好,我们一直坚持科技向善,科技扶贫的发展理念。人工智能训练师这类新职业的诞生,真真切切改变着人们的生活,AI离我们的生活并不遥远。通过这类职业的进阶过程,我们能够逐步加入到AI产业的职业生态当中。


4
人工智能训练师的未来展望
首先是关于职业的定义:使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员。


其中有一个核心点在于数据标注员和人工智能训练师的关系。在整个标准中其实包含了两个工种——数据标注员和人工智能算法测试人员。职业其实是一定特征的社会工作类别,它是一种或一组特定工作的统称。一般,一个职业包括一个或几个工种,一个工种又包括一个或几个岗位。而工种其实就是职业下具体从事某一样工作的岗位。


人工智能的学习模式分为:无监督学习、半监督学习、监督学习、强化学习

目前对于无监督学习的话,只能说未来可期,目前尚未达到无监督学习的技术要求。无监督学习诞生以后,会对智能的人工智能的应用开始一轮新的革命。因为不需要对机器做任何的监督,机器自己就能够完成一系列的学习的动作,达到产业化的应用条件。对比起来,有监督学习就需要给到机器很多的数据,需要不停地去调优它。

关于职业的定义里面,为什么人工智能训练师叫“训练师”而不叫人工智能从业人员?这个也是在做新职业申报过程当中,人社部的专家一直在探讨的。

人工智能做出来后,还涉及到算法模型优化的过程,这要求我们在实际的工作当中让算法模型不停地去吸收,不停地去迭代。这也是人工智能技术所区别于以往电力、蒸汽机等技术的显著特征,它可以通过不停的去应用,使自身不断变得更好。


如图是我们在整个标注市场的规模。从中可以看到一个非常大的趋势——中国AI基础数据服务行业的市场规模呈现着加速上升的趋势。目前,中国做人工智能领域的应用级别在全球是非常领先的,因为中国每天都会产出非常庞大的数据。

对于这么多的数据,人工智能很多是没有办法直接去应用的,那么就需要去通过人去标注以符合机器算法的训练模式。随着数据量的增加,届时就需要更多的标注人员去完成数的标注的工作。


人工智能技术类似于过去的工业革命,它极大地提升了生产效能,它使得以往受限于成本没有办法去做到的一些事情得以重新开展。

过去,疾控中心如果想统计哪些人员还没有打疫苗,并且去催促去完成第二针疫苗的接种,只能通过人去上门沟通或者打电话,但是中国14亿的人口基数意味着这样的工作几乎是无法开展的。而现在通过人工智能,则能够更为方便、高效地完成这一工作。

另外,现在很多的企业也都在使用智能外呼,即通过人工智能去拨打电话。通过人工智能训练,人工智能能够去精准地识别对话过程当中用户的意图,让对话能够更顺畅的进行下去。


那么人工智能产业化落地后会不会造成大量失业的情况?

举个例子, ATM机出现的时候,其实也有很多的银行的从业人员担心会失业。但是现实情况是,ATM机的出现其实加速了银行行业发展起来,银行业的规模得以迅速扩大,最终吸纳了更多的就业人口进来。

第二个例子是手机银行和网上银行。目前看来网上银行基本上已经变成了我们生活中一个刚需品,基本上每个人的手机里都会装在有银行的APP,但是这其实也没有影响到银行的从业人员,但是却变革了很多银行的业务。网上银行的办理方式使客户能够更高效地办理业务,整个银行的效能得到了提升的同时,银行人员的就业规模也在逐步的增加。


第三个例子是客服行业。现在来说,客服从某种意义上讲是受到整个智能化冲击最大的职业,大家在网上购物或者电话咨询商家的时候往往都是一个机器人在回答问题。

如图我们可以看到,中国的客户中心的增长率从2010年到2015年达到了百分之十几乃至二十几,但是从2015年开始增长率就急转直下。与之对应的是智能应用在2015年的时候基本上开始逐步的爆发,在 2015年阿里也首次提出了人工智能训练师的概念。

从这里我们也可以知道,智能技术的应用对于一些行业的从业人员并不会产生太多影响,但是确实对于一些行业的从业人员则会提出来非常大的挑战,客服行业就是一个非常典型的例子。可以预见,基础类的咨询业务在未来的3~5年的时间,甚至可能更短的时间里面基本上会逐步的消失掉。未来一个主管带着若干员工的模式可能会变成一个主管带着若干机器人的模式,这体现出了生产关系随着生产力的变化而变化。


人工智能训练师的在整个社会经济发展当中的意义何在?

· 对于个人来说,将会出现一个新的职业选择。智能工具的应用伴随着生产关系的变化,按照国务院的人工智能发展纲要的一些规划,我们需要培养更多的掌握人工智能+的复合型的人才。我们希望通过这样的一个岗位以及人工智能实际应用,向整个社会的人员去传达出一个很明确的信号——人工智能其实并不是高高在上的,它是跟我们的普罗大众、和我们的日常就业息息相关。


· 对于企业来说,能够帮企业全面实现智能化转型,用好智能化工具降本增效,激发了企业在组织层面的进化。


· 对于社会来说,人工智能的应用确实使很多的岗位消失,但是随着应用的加深,也会诞生许多新的岗位和新的机会。与此同时,一些过去因为受限于成本或生产力水平没有办法做到的一些事情也会变得更加容易,得以真正开展。


最后期待我们国家的人工智能训练师的水平以及人工智能的应用水平能够达到国际上的先进水准。过去的第一次、第二次、第三次工业革命都是由西方进行主导的,但是目前我们可以看到很明显的一个趋势——人工智能这一轮的生产变革,中国至少是跟国外是并驾齐驱的。所以在这个领域里面,我们也希望在这一轮的技术的变革里,中国能够真正去引领世界技术的发展潮流。



 PPT原件获取,请联系AAIG课代表⬇️


 更多AI治理干货,请关注AAIG公众号


追AI的人 往期推荐点击标题查看文章

给AI当老师?人工智能训练师让AI更通"人性"!《追AI的人》第9期来咯!



36万人关注的AI治理交互栏目—《追AI的人》年终总结~我们一起向阳成长!



硬核前沿!万字厘清因果推理融入机器学习:浙大况琨《追AI的人》第8期直播回放



2021年最热方向之因果推论能改变下一代AI研发吗?《追AI的人》第8期来咯!



内容风险知识图谱是怎样炼成的:如何应对强对抗下的内容安全挑战?—《追AI的人》第7期直播回放



揭秘阿里安全最神秘的风险知识图谱—《追AI的人》第7期来咯!



缸中之脑详谈:科幻作家和虚拟主播讨论科幻世界中的人工智能伦理—《追AI的人》第6期直播回放



科幻作家眼中的人工智能是什么样的?双翅目带你从科幻视角探究人工智能和伦理道德的关系!《追AI的人》第6期来咯!



全网17万直播观看的PPT公开:准备好进入虚拟世界和数字人共存了吗?—《追AI的人》第5期直播回放



数字人,我的新同事:《追AI的人》直播第5期来咯!



PPT公开:人工智能触犯刑法该如何处罚?责任谁承担?刑法介入人工智能风险规制的慎思!—《追AI的人》第4期直播回放



刑法介入人工智能风险规制的慎思:《追AI的人》直播第4期来咯!



AI好科技(3)AI一眼识别"你算什么鸟"?—《追AI的人》第3期直播回放



低碳AI好科技(2):如何降低超30%的算法调用成本?畅聊多专家结构—《追AI的人》第3期直播回放



低碳AI好科技(1)顶会冠军Writeup:目标检测比赛的常用方法有哪些?—《追AI的人》第3期直播回放



三个学霸的顶会Paper中奖座谈会:《追AI的人》直播第3期来咯!



(下)算法黑箱到底要不要打开?万字长文讲述:如何构建更合理的算法透明规则—《追AI的人》第2期直播回放



算法黑箱到底要不要打开?万字长文讲述:如何构建更合理的算法透明规则(上)—《追AI的人》第2期直播回放



打通外卖骑手算法的任督二脉:《追AI的人》直播第2期来咯!



50页!《AI与安全治理的恩怨情仇》PPT快来下载~真香!—《追AI的人》第1期直播回放



正在直播!AI讲师的PPT里竟然还有软色情...



AI与安全治理的恩怨情仇?《追AI的人》第1期直播来咯!


这个AI不太冷 往期推荐点击标题查看文章

“算法偏见”是概念炒作吗?「这个AI不太冷」第3期带你揭秘现实AI!



你会和虚拟人谈恋爱吗?「这个AI不太冷」第2期带你了解现实、应用中的虚拟人!



"人工智障",是算法翻车还是人翻车?跨界科普栏目「这个AI不太冷」第1季上线咯!


产业实践 往期推荐点击标题查看文章

饿了么发布《2022蓝骑士发展与保障报告》【附报告下载】



人工智能训练师:训练机器人是怎样一种体验?



阿里深度伪造视频检测技术获评第三届中国人工智能大赛最优级



阿里巴巴发布《虎年春节消费趋势报告》



AAIG受邀参加护脸计划评审会议,共建人脸识别合规应用的健康生态



AAIG应邀参加CNCC 2021“数字服务的监管与治理”技术论坛



博士毕业后,他在淘宝“扫垃圾”?



阿里AI黑科技成团出道,可防火防伪防疫还能反诈鉴黄与打假……



阿里“塔玑”太逼真:外籍模特不再吃香?



万能的淘宝上买不到什么?



阿里建全球最大奢侈品商标数据库:无偿提供给全球科研团队使用识别假货



AAIG参与发布《人工智能产业担当宣言》



一场猎杀AI的残酷游戏:把枪口对准人工智能,是为了吓退黑暗丛林中的对手



阿里实人认证安全性通过FIDO全球权威认证



多举措提升直播品质 阿里协助警方侦破直播售假案



为AI攻防测能力,清华联合阿里、RealAI发布全新测试基准平台Adversarial Robustness Benchmark



阿里巴巴成立人工智能治理与可持续发展实验室(AAIG)



巡检「局部抄袭」,阿里服饰版权算法入选AAAI 2020



阿里新一代安全架构核心AI技术夺冠,机器阅读理解准确率战胜人工



复工潮的疫情防控多了一双“火眼金睛”——AI防疫师



阿里研发AI技术可识别拦截数十国多语种脏话图



为了对付羊毛党和黑灰产,电商平台的AI大招是这样放的



阿里自研芯片亮相的同时,张勇对外公布了这一计划



治理重构,塑造平台经济的健康生态——《中国平台经济健康指数》报告发布



在阿里巴巴园区过双十一,是怎样的体验?


技术干货 往期推荐点击标题查看文章

史上首次,强化学习算法控制核聚变登上Nature:DeepMind让人造太阳向前一大步



元宇宙是新技术还是新泡沫?



AI在茫茫人海中,看到只有你被Deepfake了



给AI系统做“安全体检”,阿里安全提出自动化AI对抗平台CAA | AAAI 2021



给图片打「马赛克」可骗过AI视觉系统,阿里安全新研究入选ICCV 2021



你算个什么鸟?AI十级“找茬”选手诞生



「启发式领域适应」成果入选NIPS2020,新一代算法「鉴黄师」诞生



4项新一代安全架构核心AI技术沉淀的论文被国际会议ICASSP收录



用“算法”模拟光束可攻击自动驾驶车辆,专家呼吁重视AI安全



张钹院士解读AI安全治理三大痛点+信通院AI数据安全治理的七条建议



准确检测DeepFake视频,阿里新算法从多个人物中识别被篡改的人脸



只要AI跑得快,色情黑话就追不上我



让 AI 训练 AI:揭秘阿里、浙大的 AI 训练师助手



阿里AI技术获国际视觉大赛双冠军 “低碳AI”降低30%算力成本


爱心公益 往期推荐点击标题查看文章

“长辈模式”、数字化“养老助餐”、在线医保购药——“饿了么”适老化改造让数字化生活服务更普惠




为数十万盲人修建网络盲道:阿里的追光者每天为数亿张图片把脉,帮助盲人“听图”




半夜,他偷偷在互联网上呼救



被隔离的阿里安全工程师们:11 天造出疫情 AI 防控系统


AAIG CUP 往期推荐点击标题查看文章

抱大腿攻击是什么?AAIG CUP暨第三届 Apache Flink 极客挑战赛启动!


更多人工智能治理和可持续发展

技术干货+产业实践分享

点击下方名片关注和星标

【阿里巴巴人工智能治理与可持续发展实验室】

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存