查看原文
其他

考试季,AI又来辗压人类了

2018-01-05 二岳初 读芯术

科技时代,我们更加怀念温暖邂逅的时光

后台回复“想要”,得到近期有温度的推荐

全文共2564字,预计阅读时长3分钟



还在学校的同学们,听说考试周又到啦?



读芯君也和大家一样,沉浸在知识的海洋的无法自拔……学到昏厥……



既然提到考试(MS这是个悲伤的话题),我们就来聊聊AI在考试中的技能吧:


机器人参加2017年高考数学考试


成都的AI-MATHS高考机器人参加了2017年高考数学的测试,在掐断题库、断网、无人干涉的情况下通过综合逻辑推理平台来进行解题。


“高考机器人”AI-MATHS分别用了22分钟和10分钟完成了今年高考北京文科数学卷和数学全国卷二,最终分别获得105分和100分,平均分102.5,属中等成绩。



AI批改一篇作文的时间只需40秒



在这批试卷上,阿里AI用代表不同意义的符号在试卷上,精确地圈出外国留学生们的多词(Redundant)、缺词(Missing)、错词(Selection)和词序错误(Word Order)等错误位置,完成了对作文的批改。据了解,把AI应用到外国人学中文试卷批改上,是全球首例。


“批改一篇作文的时间通常只有40秒”,对于人类老师来说,在海量的试卷面前,允许批改一份作文的时间有限。阿里“AI老师”在准确率和细致程度都是接近甚至超乎人类的水平。
 


一份浙外老师提供的试卷中,在“请写一写你的爱好”的命题作文下,一位外国学生提到自己的爱好是中文,并在作文中写道:“中文的难点并非是字,而是像女朋友一样善变。我是不会放弃的,除非中国人也放弃我才会放弃。”


对于这两句话,某汉语系教授表示:“我教了14年的中文,不认真看还真没看出问题。但事实证明,这两句话都是病句,存在杂糅和重复的错误。”他忍不住飙了病句:“AI简直非人类了。”



说是这么说,但AI目前能干的事情,好像只有查找错别字和分析句子是否有语病。从发布的消息可知,机器人在学生们的试卷上精确圈出了多词、缺词、错词、语序错误等, “批改一篇作文的时间通常只有 40 秒”。一篇 200 字不到的作文,机器人用几十秒时间找出了 8 处语法和用词错误。因此,牛逼的方面还是停留在机械性的东西上。



从技术的角度看,对于这个项目,AI是学习了几十万的中文语言体系,通过扫描仪读取试卷信息,使用OCR技术将其转换成文本,之后启动自然语言处理算法进行分析,并识别出错位类型和位置,最后批注在试卷上的。但是,这里有一个问题,机器人对整篇文章写得好不好,有没有文采,好像还是缺乏判断的。



当然,人工智能的能力有没有可能更进一步,整体来评判一篇作文?


科大讯飞研究院北京分院副院长付瑞吉同志此前在一篇眼镜中说到一个技术,即人工智能有一个核心的算法是Attention,简单通俗理解就是注意力神经网络,它可以模拟人脑的思考过程。


比如评判一篇作文的主题时,注意力会集中到它的内容是否符合题目要求。如果评判立意,就要看作文的思想是否符合主流价值观,如果评判语言表达,就看文章的遣词造句、修辞手法等。


在不同的方面人工智能的注意力也是不同的。通过收集到的大数据,人工智能将学习人类老师评分习惯,把评分的准则学到神经网络当中,当新的试卷出现,基于Attention的网络,就可以对新试卷进行评判。



AI拯救记忆,人类获得超能力不是梦想?


读芯君希望在期末复习的时候,能拥有过目不忘的超能力……



不至于出现以下情况:


 

在11月中旬举行的美国神经系统科学学会(SfN)年会上,南加利福尼亚大学生物医药工程副教授宋东首次公开了他们的科研成果:


他们发现,通过在20名患有癫痫的病人脑中植入脑电极设备,就能将他们的记忆有效提升15%至25%。并表示,这对患者形成新的记忆有着很大的帮助,还有利于患者形成长期记忆。



目前全球有很多医院已经能够进行电极植入手术,这就好像在人脑中安装一个“起搏器”,原理和心脏起搏器一样,通过深部脑刺激来改变脑部的神经活动,进而影响患者的肢体行动。但此前,这种刺激脑的方式用于情绪障碍的治疗时,收效甚微。宋东团队的突破在于解决了提高患者记忆力的问题。


提高记忆力对于紧张备考的学生或者是对于记人名有困难的人来说,可以助他们一臂之力。


AI在多项考试中连续通关


早在2017年高考数学真题揭晓之后,机器人“AI-MATHS”在一间关闭外部网络的房间里作答2017高考数学全国II卷,现场模拟考场环境,用警戒线将机器和人隔开,确保没有操作者可以靠近机器递送“小抄”。结果“AI-MATHS”用时10分钟作答全国II卷拿下100分(总分150分),表现突出。


据专家分析,AI答题的最大困难时是看不懂题,很难看懂人类语言。比如:10-1=?机器人会很快答出来,但是,如果题目换成:有10个苹果,小明吃掉了一个,请问还剩下几个的时候,机器人就傻眼了。


 
为了克服这一现象, 在考试之前,专家们就对机器人进行500套试卷,12000道题目的魔鬼训练,才能取得预期的分数。


“晓医”首次参加全国临床执业医师考试


前不久,智能机器人“晓医”首次参加2017年度全国临床执业医师考试,并以超过及格线96分的成绩成功通过了考试。更让人意外的是,在连续四场考试中,“晓医”场均考试时间仅为15分钟。


对于人工智能而言,要想通过医学综合测试,技术上存在很大难度。没有提前背诵题库,通过学习了53本医学教材,熟记了上万份临床指南和经典病例,并用上述知识储备去解答执医考题,是“智医助理”考出好成绩的关键。


另一个重要的原因是“智医助理”拥有语意识别功能,通过“语义张量”方法,可以使其拥有并合理运用庞大的医学知识库,在运用知识分析和解决问题方面,“关键点语义推理”、“上下文语义推理”、“证据链语义推理”在内的多尺度融合推理算法,让“智医助理”具备多层次推理能力。




笔试的题型每年都在变化,因此对于机器来说,每年的笔试都是“全新”。此外,笔试题型可分为“知识点型”和“病例型”两种,2013年以来,新的考试大纲要求加强对临床思辨能力的考核,导致“病例型”试题比例在不断提升,目前已经达到50%以上。因此,单纯依靠记忆能力和快速检索能力答题,显然行不通。其表示,“智医助理”通过医考,是因为其具备了自主学习、自主推理、自主判断能力

读芯君开扒


人工智能在“备考期间”并没有使用我们以为的“题海战术”,而是通过大量的学习和记忆从而具备了推理、判断的能力。反观我国的教育,虽然近几年一直强调个性化学习,但“题海战术”依旧是我国目前教育的主流手段。应试教育的愈演愈烈在人工智能的冲击下可能会发生极大的变化,寒窗苦读即便换来金榜题名,却可能蓦然回首,发觉人工智能早已等在灯火阑珊处。


同时我们可以看到,未来有一天,相信所有的试卷都是可以通过机器来阅卷批改的。那么问题来了,到了这个时候,还要老师干嘛?这是一个值得思考的问题,读芯君认为老师终于能真正意义上从事务中解脱出来,花更多的心思放在对学生的引导上。


留言 点赞 发个朋友圈

我们一起探讨AI落地的最后一公里


作者:二岳初

参考文献:

http://mp.weixin.qq.com/s/fCiSG_WGkt9_TQkJy85zcQ
https://baijiahao.baidu.com/s?id=1586806132670722154&wfr=spider&for=pc

如需转载,请后台留言,遵守转载规范


推荐文章阅读


颤抖吧!不懂Python语言,你将是新一代文盲

你说“我很好”,其实是你在逞强

不怕看AV,就怕看AV的人还懂AI!

小朋友都看得懂的AI发展史

南大闯进野猪 有AI就好了

三大“AI码农”:我的起薪30万 (上)

三大“AI码农”:我的起薪30万 (下)

想死?AI不同意!

世界首位机器人“公民”索菲娅称家庭很重要

前沿 | 性爱机器人上市,你会和她啪啪啪吗

独家点评 | 外媒眼中最酷的10大机器学习应用

这5个产业,将被人工智能彻底改变


长按识别二维码可添加关注

读芯君爱你



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存