查看原文
其他

EP02 | AI面试官,你为什么不喜欢我?

声小音 声动活泼 2022-07-27

本期文字整理自声动活泼出品的声音特稿「跳进兔子洞」


▲ 右滑查看完整插画


对着手机镜头回答 3 个问题,再朗读一段短文,最后说「茄子」来张自拍。不到 15 分钟,你就能完成一个只有你一个人参与的面试。


当你关掉摄像头的一瞬间,一个百分制的成绩就会跟你的自拍照绑定在一起,然后被递交给负责招聘的HR。


这是人工智能面试的流程。换句话来说,你,被一个冷冰冰的机器面试和打分了。


本该充满互动的面试由此变成了一个生产间:求职者们仿佛是流水线上的一个个物件,在经过精密的计算公式和复杂的数据分析后,被机器打上了「通过」或者「淘汰」的标签。


然而, 这么判断的结果够准确吗?或者再回到最基础的问题,机器能不能成为判断我们能力的把关人?






三年前,Angela 有过一次被人工智能面试的经历,她觉得挺奇怪的,「因为屏幕上只能看到自己, 就完全没有反馈。」


面试结果很快就出来了,Angela 顺利通过了 AI 的考验,进入到了终极面试。Angela 后来猜测,这次成功的关键就在于她说中了几个 AI 喜欢的高频词汇。


「比如说第五道题,尽管有捷径可以走,但是依然选择诚实道德的一个方式?然后你里面就会提到一些关键词:比如说这个事情到底什么地方有违公司的原则, 然后我经过了什么样的思考发现这个事情确实是不能做的。假如提到了这些关键词,我觉得这个面试就是成功的。」


在伦敦政治经济学院上学的小杨,不久前也接受了一次 AI 视频面试。不过遗憾的是,她收到的是一封拒信。在经过一番网络搜索之后,小杨总结,AI 不喜欢自己的主要原因就在于她不够「戏精」。


「我看那些成功人的经验,就是你要表情夸张一些,然后语气要上扬一些。一般来说你要是展现的像美剧里面特别戏精的样子,就八九不离十可以过。」


Angela 和小杨的猜测对了几分?


为了回答这个问题,我们的制作人佳勋决定亲自去体验一把 AI 面试。


这次体验的产品是智联招聘研发的一款人工智能面试工具「AI 易面」,面试的岗位是通用岗位。在面试中,应聘者需要对着手机的镜头回答机器提问官的问题。


「准备好了吗?」手机上传来了一个用机器合成的女声,「那我们开始面试。」


面试中,机器提问官会给应聘者一分钟的思考时间和三分钟正式回答的时间。整个面试包含了四道问题,包括对职位的理解、分享一件最能体现责任心的事情、如何跟同事解决分歧以及要求朗读一段短文。


大概四分钟后,面试结束;同一时间,系统后台就生成了一份有具体分数的测评报告。


智联招聘测评研究院的产品总监田娟娟说,这款产品更多用在企业招聘的初筛阶段,「我们给企业的建议就是在初筛阶段更多地测查一些基础素质。比如说候选人只有三十分、四十分这种水平很低的,我们就建议企业淘汰。」


佳勋的测评报告(她说她并没有认真答题)


田娟娟解释,在这次体验面试中,四道问题主要考察了四个方面的素质:责任心、沟通能力、普通话和形象气质。


「基本上常见的一些岗位在我们的库里都会有一个素质模型去考察。我们后台有 50 多个考察素质维度,企业会通过不同的组合和匹配方式去考察不同的岗位。」


接下来,人工智能开始工作。当设定这个岗位的人需要考察一些市场洞察能力、判断能力、人际沟通能力的时候,这几个素质维度后面拽着的那些小题目就会被自动搜索和识别。


当你回答完机器给你挑选的一道问题之后,打分环节开始。在这之前,人工智能通过学习大量的真实面试案例,已经搭建出了一个优秀回答的模型库。田娟娟解释,影响分数高低的因素之一,就在于你跟模型的相似程度。


「我们告诉机器人,我说如果他回答到了以下 15 个方面,包活沟通的意愿突出、沟通的表达技巧好等等,那可能就会得一个高分。」


当然,读取语音和判断语义只是人工智能面试官的一个基础功能。在面试的过程中,人工智能还会不断地给你拍照。你是兴奋的还是慌张的,也直接影响你最终的得分。


田娟娟解释,人工智能面试官会结合表情点位上的 150 个面部表情来判断候选人的情绪,「比如说焦虑、紧张、愉悦、兴奋或者生气。」


在实际操作中,人工智能会计算你不同情绪的占比时常,从而去判断你的热情度和亲和力。


「比如说你的愉悦持续时长非常长,我们综合判断你是一个情绪积极的人。当你生气的表情、愤怒的表情占比超过一定数值范围的时候,就会判断你的情绪的正能量不够强、情绪不够积极。」





被人工智能面试难免会给人这样一种感觉:应聘者仿佛变成了流水线上的一个物件。在经过精密的计算公式和复杂的数据分析后,他们被给予了通过或者淘汰的标签。但是,人毕竟不是产品,这么筛选出来的结果真的足够可靠和准确吗?


中国市场上现有 AI 视频面试产品的官方数据显示,人工智能的效果并不差。


智联招聘的田娟娟说,AI 易面曾经做过一个面试效果的研究,结果发现人工面试结果和机器面试结果的一致性非常高。


「其实在第一年做的时候,有很多企业也关注了。有几家企业说我们这么大规模招聘全用机器靠不靠谱?后来我们找了一些内部的面试官做了一轮复审,发现机器判断和人工判断的重合率达 98%。」


市面上比较主流的 AI 面试产品的数据也显示,机器判断和人工判断的结果基本相同。比如说由招聘网站猎聘研发的 AI 面试产品「魔镜」的人机一致性达到了 85% 以上;已经在飞书和钉钉上线的 AI 面试系统「方便面」的准确率是 96%;为肯德基和顺丰提供 AI 面试功能的产品「海纳人才」称,自家 AI 的准确率高达 98% 以上,并且结果完全不需要人工再审核。


海纳人才官网列举的数据


专注于研发 AI 视频面试技术的公司,AI 得贤招聘官的 CEO 方小雷说,他们的数据显示,在筛选人才的准确度上,「机器已经远远超过了人类。」


方小雷解释,机器会给每一个候选人打上很好、一般、差三个等级。然后再请人类面试官给相同的候选人打等级,从而得出对比结果,「机器 PK 人类,胜出了 20 个点。」


方小雷说,在现实情况中,大型企业在校招季的时候一天可能要进行上百次面试,面试官难免会因为疲惫而影响自己的判断。另外,不同的面试官有不同的意见,主观偏见和歧视更是难以避免,「所以很多时候都是运气比较好的人能有机会进入到后续的面试」。而这些短板恰恰是人工智能可以弥补的,「 AI 面试官其实是给到候选人一个公平公正的机会去在一大群的候选人中脱颖而出。」


在互联网大厂做过 HR 的小方举了这样一个例子。他说,假设公司准备招聘一个 java 工程师。职位放出后总共收到了 1000 份简历,在经过第一轮简历初筛后,500 份简历进入到了下一轮的视频面试。


但很多时候的情况是,在 HR 面试前 10 个人的时发现,有一个人不错,最后就录取了他。那就意味着,后面的 490 份简历会被自动淘汰。但问题是他们其中会不会有更优秀和更适合这个职位的人选呢?


小方的回答是,这个肯定会有,「但是这个不重要。一般来说一个岗位出来,业务团队可能都会有一个要求,说我希望这个人一个月能到岗。你不可能无限制地去把这些人都聊完。所以最重要的一个事情是你找到一个合适的人,这个人是合适的,不一定是最合适的。」


试想一下,如果在面试流程中加入人工智能,暂且不说结果的准确性,至少这 500 个候选人都可以得到一次面试的机会。而根据多家 AI 视频面试产品的数据统计,给 500 个面试打分,通常情况下只需要几分钟的时间。





这个更省时,也对求职者相对更加公平的工具却让大部分 HR 充满质疑和困惑。


Mark 是一个有 14 年经验的资深 HR ,曾经在传媒行业、软件行业从事过人力资源的相关工作。对于人工智能面试的准确性和灵活性,他抱有怀疑的态度。


「我现从事的地产这个行业,对人的要求和复杂性要高很多。尤其是像比如说我们觉得一个岗位它的成功因素是团队合作性、沟通能力这些东西。那我们现在 AI 的所谓这些技术,你怎么去判断一个人的沟通能力怎么样?你协调能力怎么样?人还判断不准呢。」


Mark 说,尽管人工智能可以对优秀答案的要素进行学习,但别忘了,一个开放式问题,永远都没有标准答案。


「你比如说我问你遇到过的最难的客诉是怎么样的?那么这个开放性的问题可能有千奇百怪的答案,比如说他回答的可能不是你的标准答案,但是人家也解决了这个问题。」


跟 Mark 一样,曾经在互联网大厂担任 HR 的小方也认为 AI 视频面试的结果并不可靠,「现在有很多,你不用想也知道,现阶段用它肯定是一团糟。」


在小方看来,AI 面试更像是一个视频形式的性格测试,它最多只能作为一个辅助判断的考量。「因为人不是流水线上通过计价这种形式来判断的。甚至连 HR 自己都没有办法去完整地判断说这个人是不是真的合适。」


有八年服务行业从业经验的 HR 小 J 说,酒店在招聘员工的时候,主要考察的是一个人的服务态度,「那人工智能我个人认为它是可以筛选出来这个人的知识和技能,但是它没有办法判断这个人的态度。」





在国内,人工智能面试仍然处于一个起步的阶段。但在国外,这项技术其实已经被广泛运用了很多年。


根据美国咨询公司高得纳发布的一份调研报告,在 2020 年,美国已经有超过 86% 的公司实现了视频面试的智能化和自动化,而 AI 面试就是其中最受欢迎的一个工具。北美一家有名的虚拟视频面试公司 Hirevue 统计,它们的产品已经发起了超过 2600 万次的面试。


技术火热的背后,却充斥着来自学者的担忧。


美国东北大学心理学教授丽莎·巴雷特(Dr. Lisa Feldman Barrett)曾经做过一份关于 AI 算法能否识别情绪的研究。结果发现,AI 系统在检测面部运动方面相当敏锐。比如,检测技术可以识别出微笑和皱眉之间的区别。但很多时候,人工智能是无法正确理解这些运动的实际含义。


巴雷特举了一个例子:当电脑看到一个人皱眉的时候,会认为他很容易被激怒,从而判断他不适合做一名销售人员。但真实情况是,有的人努力集中注意力的时候会皱眉、有的人感到困惑时会皱眉、有的人想放屁的时候也会皱眉。


在实验中,巴雷特发现,皱眉和生气的对应率只有 32%。也就是说,当一个人皱眉的时候,有将近 70% 概率是他并不生气。


巴雷特认为,心理学家研究了 150 年还知之甚少的情绪与表情的关联,却被许多科技公司认为已经攻破


巴雷特认为,如果想要准确地通过一个人的表情来判他的情绪,机器必须通过一个像我们身体那样多元、复杂的系统来理解所有的社会性背景。如果只是单纯地看最后的表情反应来进行判断,结果一定是不准确的。


而除了对表情和情绪的判断有误差之外,人工智能在读取我们语音的时候也可能会理解不了我们到底想表达什么。


智联招聘的田娟娟解释,对一个回答进行解析其实是个极其庞大的工程,「我们收集了词典库里的几千万个词汇。对于它做大类上名词、动词、形容词的这个划分,形容词每一个词下面又分为积极还是消极。每一个词都会有对于它的一些属性字段的标记。比如说它是行为的还是心理的还是态度,它是事情发展前、发展中还是发展后的。」


田娟娟的团队最后总结出来三万条我们日常表达过程中常用词汇。但是,这远远不足以覆盖所有候选人的词汇量。而这也只是机器识别语义的第一步而已。


「因为语句放在句子里,它的意思就不一样了。所以现在持续还在攻克的难题就是当语言放在句子里,怎么让它的意思和被我们判断出来的信息体现地更完整。」


尽管 HR 们不大相信人工智能的筛选能力,但他们并不拒绝在招聘环节中引入 AI。


他们看来,当一个职位所需要的技能是可以被标准量化的时候,机器自然比人的效率和准确度要高得多。


资深 HR Mark 举了一个例子:「流水线上的操作工需要这个人的反应能力、敏捷能力和之前的经验。如果说一个人的技能可以会被量化到足够精确,而这些东西和他的职位的成功度能够达到较高的匹配程度的时候,使用 AI 完全是没有问题的。」





在招聘的另外一端,庞大的求职者群体有着跟 HR 们不同的感受。相比于 AI 到底是怎么运作的。他们更在意企业在招聘信息上的透明和公开度。


正在找工作的小杨认为公司应该提前告知面试评分是完全基于算法的,而且算法会基于她的面部表情和语气来做判断,「要告诉我们更加多的信息,不要搞这么多的信息不对称。」


那企业需不需要提前告知求职者面试的性质,甚至是判断标准背后的算法逻辑呢?


制作人佳勋在采访的过程中发现,大多数企业在发出面试邀请的时候不会直截了当地告诉候选人,这个面试不仅是机器来读问题,还是机器来打分。


比如说智联招聘的「 AI 易面」在面试正式开始前,会发短信通知候选人关于面试的流程。但候选人只知道这是一场线上面试,具体的形式和评判标准并不透明。


当然,借助于发达的网络,也有不少找工作的人会先去各大论坛上寻找经验。不过田娟娟说,这种准备方式并没什么用。「因为题库里是有很多题可以随机调取的。除非是同一场同一批次一起考的题是一样的,你下一场考绝对是不一样的。」


《哈佛商业评论周刊》在今年发表的一篇报告建议,尽管让科技公司公布算法极其困难,但招聘企业至少可以把有些规则放在玻璃盒子里。比如展示真实成功面试者的案例,或者是提供专门的培训来告诉应聘者怎么才能在镜头前表现地更加专业。


关于 AI 面试经验的教学视频


现在,并不是所有行业都对 AI 面试保持着开放的态度。接纳度比较高的行业包括金融、银行、通信和互联网,同时校园招聘的使用频率会也远远高于社会招聘。这背后的原因可能是这些行业对初入职场的年轻人考察的素质大多相同。


多家研发人工智能面试的公司透露,现阶段,AI 不会把它不认可的候选人从后台中直接删掉,企业仍然可以复审人工智能给出的建议。


那么10、20 年后呢?被机器面试和打分会变成找工作的新常规吗?


HR 们觉得,完全有可能。


而找工作的我们,对人工智能面试官有着更复杂的情感。


不久前,一个叫做 Ryan 的美国年轻人分享了一件发生在自己身上的趣事。他说,他申请了亚马逊仓库捡货员的职位。在提交完申请后,亚马逊就给他自动发送了虚拟面试。完成面试的 20 分钟后,他就收到了录取的通知。通过这么简单的面试,就能成为科技巨头的员工让 Ryan 兴奋不已。但入职后,Ryan 感到了巨大的不安和困惑。他说,公司不跟我见面就能相信我有能力来完成这份工作吗?他们真的在乎我这个人吗?


再说回三年前被 AI 面试过的 Angela。她虽然通过了那次面试,但却在最终的 superday,也就是长达一整天的终极面试中被淘汰。现在,她的角色已经从一个应聘者转变为一家软件公司的招聘人。


或许,有一天人工智能会代替她的工作吗?她觉得理论上或许吧,但现实中,这个问题早就有答案了。


「人毕竟怎么说,还是可以去有这个创造能力,然后可以去相互关怀。我们一直在说这个机器的发展,一开始是工业革命可能会带来失业。后来又说互联网会带来失业,但是现在大家还都是 996, 不是吗?」




兔子不明白,为啥只得了 38 分。


忘了最近听哪个播客说到,为什么很多画儿都叫「无题」,因为说透了就没想象空间了。所以这次我决定少说点。


诶嘿,我们下期见。



主播&制作人

佳勋


幕后制作

编辑:徐涛

监制:楚樵

设计:饭团

运营:Yao、Beibei



关于节目

这是一个飞速发展的世界,新事物正在以最快的速度被创造、应用,并未经同意地塞进每一个人的生活中,将大家带向一个未知之处。


由声动活泼出品的「声音特稿」节目

「跳进兔子洞」,会带你去探索那些被科技商业浪潮淹没的个体故事。


一起去看看新兴事物正在将我们带向哪里?


 每隔周二更新 

请在各大音频平台搜索并订阅

来一起「跳进兔子洞」


更多采访手记将更新在 newsletter 中

点击链接了解订阅方式



期待与你交流

即刻:@声动活泼即建队

微博:@声动活泼

邮箱:ting@sheng.fm

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存