查看原文
其他

斯坦福全球AI报告:人才需求两年暴增35倍,中国追赶速度惊人

药明康德AI 2019-06-30

本文经AI新媒体量子位(公众号ID:qbitai)授权转载,转载请联系出处


从去年开始,斯坦福大学主导、来自MIT、OpenAI、哈佛、麦肯锡等机构的多位专家教授,组建了一个小组,每年发布AI index年度报告,全面追踪人工智能的发展现状和趋势。


“我们用硬数据说话。”报告的负责人、斯坦福大学教授、前任谷歌首席科学家Yoav Shoham谈到这份最新的报告时表示。


今年的报告,从学术、工业、开源、政府等方面详细介绍了人工智能发展的现状,并且记录了计算机视觉、自然语言理解等领域的技术进展。



报告要点:


一、美国AI综合实力最强


美国的AI论文发布数量虽然不是第一,但美国学者论文被引用的次数却是全球第一,比全球平均水平高出83%。


2018年美国AI创业公司的数量,比2015年增长2.1倍。而从2013年到2017年,美国AI初创企业获得的融资额增长了4.5倍。均高于平均水平一倍以上。


二、中国AI追赶速度惊人


清华2017年学AI和机器学习的学生数量,是2010年16倍。


70%的AAAI论文来自美国或中国,两国获接收的论文数量相近,但中国提交的论文总量比美国多30%。


基于经同行评议论文数据库Scopus的数据,2018年发布AI论文最多的地区是欧洲(28%)、中国(25%)和美国(17%)。


与2000相比,2016年中国AI学者论文被引用的次数,提高了44%。


中国一年的机器人部署安装量,从2012到现在增长了500%。ROS.org来自中国的访问量,2017年比2012年增加了18倍。


三、全球AI发展提速但仍不均衡


2017年,全球机器学习(ML)人才需求已经是2015年的35倍。


整体来说,自2016年以来,美国、加拿大、英国政府在国会/议会会议中对人工智能和机器学习的提及激增。


80%的AI教授是男性,统计数据来自UC伯克利、斯坦福、UIUC、CMU、UC London、牛津和苏黎世联邦理工学院。


美国AI工作岗位的应聘者中71%为男性。


看过这份报告之后,人工智能大牛吴恩达总结了两点:1、AI正在快速发展,不管是学术界还是工业界都是如此。2、AI的发展仍不均衡,在多样性、包容性方面仍需努力。


以下是这份报告的主要内容:

AI论文情况分析

发表总量增长迅猛



从1996年到2017年,CS领域的年发表论文增长了约五倍 (6x) ,AI领域的年发表论文增长了约七倍 (8x) 。对比一下,所有学科的年发表论文总量增长了不到两倍 (<3x) 。


划重点,AI论文的年发表量,比CS论文增长要快。


各地区AI论文发表情况



2017年,Scopus上面的AI论文,有83%来自美国以外的地方。具体数据是,28%来自欧洲,25%来自中国,17%来自美国。


从2007年到2017年,中国的年发表AI论文数增长了150%。


细分领域论文发表情况



2017年发表的AI论文中,有56%来自机器学习与概率推理这一研究方向


对比一下,2010年发表的AI论文,只有28%来自这个方向。


另外,图表里显示的大部分研究方向,在2014-2017年间,复合年均增长率 (CAGR) 比2010-2014年要高。


比如,神经网络这一方向的论文发表数量,2014-2017年之间,复合年均增长率达到37% (如图中红色曲线) ,最为突出。


做个对比,在2010-2014年之间,神经网络论文发表数,复合年均增长率仅有3%。


arXiv论文



自2010年以来,arXiv论文总体呈现迅速增长,从2010年发布的1,073篇,到2017年发布的13,325篇,增长超过11倍 (12x) 。许多细分领域也呈现增长。


这表示,论文作者们倾向于把自己的研究成果传播出去,不论是经过同行评审还是在AI会议上发表的论文。这也体现了,AI这个领域竞争激烈的特质。


在细分领域中,计算机视觉 (CV) 是自2014年起增长最快的一个 (上图蓝色曲线) ,从1,099篇增长到2017年的4,895篇,涨幅近400%。


AI论文引用量



FWCI是领域权重引用影响系数,可以用来衡量论文的影响力。


报告重新定义了一种“改装版” (Re-based) 的FWCI,不按地区,而按世界平均值,来计算影响力。


在这个标准之下,虽然欧洲发表的AI论文数高于中国和美国,不过论文影响力曲线比较平缓;相比之下,中国发表的论文影响力增长剧烈:与2000年相比,2016年平均每位中国AI论文作者的引用率增长了44%


不过在这方面,美国依然全球领先,美国AI论文作者的平均引用率,比世界平均值高出83%


AAAI论文



AAAI 2018,提交论文,中美占70%,中选论文,中美占67%


中国的论文提交数高出美国约1/3,但二者中选论文数相差无几,中国入选265篇,美国入选268篇。

高校AI课程注册情况





AI和ML进军高校的速度提升了不少。


报告显示,截止到2017年底,AI课程注册人数是2012年的3.4倍,ML课程注册人数是2012年的5倍。


其中,UC伯克利的ML课程的注册人数增长最快,是2012年的6.8倍,但此数值较2016年增长速度有明显下降。



报告进一步统计了非美国地区院校AI+ML课程注册人数的变化。结果显示,清华是非美国院校外增长率最高的高校,几乎是第二名多伦多大学的2倍。


纵向对比来看,清华2017年AI+ML课程注册人数是2010年的16倍。

学术会议热度



大型会议中,NeurIPS (曾用名NIPS) 、CVPR和ICML,是参与人数最多的三大AI会议。自2012年以来,论参与人数的增长率,这三者也领先于其他会议。


NeurIPS和ICML参与人数增长最快:将2018年与2012年相比,NeuRIPS增长3.8倍 (4.8x) ,ICML增长5.8倍 (6.8x) 。


上面讨论的是大型会议,但小型会议的参与人数同样有明显的增长,甚至可以比大型会议的增长更加明显。



这里最突出的是,ICLR 2018的参会人数达到了2012年的20倍。


原因很可能是近年来,AI领域越来越关注深度学习和强化学习了。

AI创业投资情况


从2015年1月到2018年1月,人工智能创业公司的数量增长到了原来的2.1倍,而所有活跃的创业公司增长到了原来的1.3倍。


大多数情况下,创业公司的增长都保持相对稳定,而人工智能创业公司呈指数级增长。



在风投资金方面,从2013年到2017年,人工智能领域的风投资金增长到了原来的4.5倍,而所有的风投资金只增长到了原来的2.08倍。这些数据都是年度数据,不是逐年累积的。


图表中有两个高峰期,1997-2000年风投资金的激增,对应的是网络泡沫时期。2014-2015年出现了一个较小的增长,因为当时正处于一个相对较大的经济增长时期。

人才需求


报告显示,近几年,社会需要的AI相关人才大幅度增加,目前对有ML技能的人才需求最大,其次是深度学习。



可以看出,ML人才需求也是这两年增长速度最快的。


报告统计,2017年,全球ML人才需求是2015年的35倍,从2016年到2017年的增幅尤为明显。全球对AI人才的需求在2016年骤增。

机器人安装量


2012年到2017年,中国机器人年安装量增长了500%,其他地区,比如韩国和欧洲,分别增长了105%和122%。



在安装量较小的地区中,中国台湾比较突出,在2012-2017年增长最快。

开源框架GitHub标星数


各框架的标星数反映着他们在开发者群体中的流行程度。不过,因为开发者们日常不会“取关”GitHub项目,所以这些星星都是多年来积攒下的。


我们可以明显发现,TensorFlow的受欢迎程度在开发者中遥遥领先、稳步增长。



排除了第一热门,第二名和第三名分别是scikit-learn和BVLC/caffe。


TensorFlow官方力推的keras排到了第四,但近一年来几无增长势头。


另外两大热门PyTorch和MXNet分别排到了第七和第六,尤其是PyTorch,作为一个年轻的框架,自2017年初发布至今,GitHub标星数至少增长了4倍。获取新用户的势头很猛,不知道其中有多少被TensorFlow逼疯的人类。

各类任务最新成绩

这个部分分为CV和NLP两块,分别列举了各主流任务从发展之初到现在的成绩进步情况。


ImageNet图像识别准确率



2017年是ImageNet比赛的最后一届,2018年这项比赛就不再进行了。不过,验证集依然有人在用。


图中,蓝色的线条为ImageNet挑战赛历年的成绩变化,由于每年比赛所用的数据不同,旁边多了一条黄色线条,是以ImageNet 2012验证集为评价标准绘制的。


可以看出,到2015年,机器在图像分类任务上的能力已经明显超越了人眼,而即使比赛不再继续,学术研究者依然在认真推进该任务的表现。


这也侧面说明,如果一项工作有了明确的评价标准和固定的挑战内容,研究者们围绕此竞争,更容易让技术在该领域取得突破。


ImageNet训练速度



这张图是训练ImageNet图像分类神经网络所需时间的历年变化(当然,是买得起足够计算资源的人和机构所用的时长)。


从2017年6月的1小时,到2018年11月的4分钟,ImageNet图像分类神经网络的训练速度提升了16倍,除了硬件方面的贡献,算法上的提升也不容小觑。


图像分割COCO



ImageNet挑战赛“退休”之后,CV领域的朋友们就把重点放在了微软的COCO,挑战语义分割和实例分割。


四年来,COCO数据集上图像分割挑战的精确度已经提升了0.2,2018年的成绩比2015提升了72%。不过,目前还没有超过0.5,这一项还有充足的进步空间。


另外值得一提的是,COCO比赛近年来占据冠军位置的多是来自中国的公司,包括旷视、商汤等计算机视觉独角兽日常包揽数个项目的冠军。


语法分析(Parsing)



在确定句子结构这种语法分析的任务上,2003年到2018年的15年间,AI的表现(F1 Score得分)提升了将近10%。


机器翻译



在机器翻译任务上,报告拿英语-德语互相翻译举例,评估了AI模型在经典机器翻译评估算法BLEU标准中的表现。


报告显示,2018年英语转德语的BLEU评分是2008年的3.5倍,德语转英语成绩是2008年的2.5倍。


机器问答:AI2 Reasoning Challenge(ARC)



在问答领域,AI表现进步更明显,可以按月计数了。


报告统计了2018年从4月到11月间,AI在ARC推理挑战赛上成绩的变化:简单组得分从63%提升到69%,挑战组得分从27%提升到42%。


这些,都仅是半年间的进步。


机器问答:GLUE



同样用于机器问答的GLUE基准(General Language Understanding Evaluation)推出至今只有7个月的时间,但目前的表现已经比半年前提升了90%。


GLUE的推出者、纽约大学助理教授Sam Bowman说,虽然围绕GLUE的大型社区还没有出现,不过已经有了像谷歌BERT这样的代表性技术用了GLUE基准,面世一个月内已经被引用8次。在EMNLP会议中,GLUE时常被讨论,可能会成为语言理解领域中的一个基准线。


注:本文所有图片均来自AI INDEX 2018报告截图,点击“阅读原文”,可在线阅读报告全文


更多精彩文章:


MIT:近视眼看到会嫉妒,AI在黑暗中视力满分

耶鲁大学:你在偷瞄哪里,AI全知道

为什么越来越多的人喜欢在家宅着?AI表示,你的基因决定了这一切

十年后AI会让我们的生活变得更好吗?三分之一的专家不这么认为……

《自然》子刊:准确率超90%,用手机在家就可以检测HIV!


大家关注的公众号越来越多,找不到“药明康德AI”怎么办?简单四步,将“药明康德AI”设置为星标公众号,问题即可解决。



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存