斯坦福全球AI报告：人才需求两年暴增35倍，中国追赶速度惊人

药明康德AI 2019-06-30

本文经AI新媒体量子位（公众号ID：qbitai）授权转载，转载请联系出处

从去年开始，斯坦福大学主导、来自MIT、OpenAI、哈佛、麦肯锡等机构的多位专家教授，组建了一个小组，每年发布AI index年度报告，全面追踪人工智能的发展现状和趋势。

“我们用硬数据说话。”报告的负责人、斯坦福大学教授、前任谷歌首席科学家Yoav Shoham谈到这份最新的报告时表示。

今年的报告，从学术、工业、开源、政府等方面详细介绍了人工智能发展的现状，并且记录了计算机视觉、自然语言理解等领域的技术进展。

报告要点：

一、美国AI综合实力最强

美国的AI论文发布数量虽然不是第一，但美国学者论文被引用的次数却是全球第一，比全球平均水平高出83%。

2018年美国AI创业公司的数量，比2015年增长2.1倍。而从2013年到2017年，美国AI初创企业获得的融资额增长了4.5倍。均高于平均水平一倍以上。

二、中国AI追赶速度惊人

清华2017年学AI和机器学习的学生数量，是2010年16倍。

70%的AAAI论文来自美国或中国，两国获接收的论文数量相近，但中国提交的论文总量比美国多30%。

基于经同行评议论文数据库Scopus的数据，2018年发布AI论文最多的地区是欧洲（28%）、中国（25%）和美国（17%）。

与2000相比，2016年中国AI学者论文被引用的次数，提高了44%。

中国一年的机器人部署安装量，从2012到现在增长了500%。ROS.org来自中国的访问量，2017年比2012年增加了18倍。

三、全球AI发展提速但仍不均衡

2017年，全球机器学习（ML）人才需求已经是2015年的35倍。

整体来说，自2016年以来，美国、加拿大、英国政府在国会/议会会议中对人工智能和机器学习的提及激增。

80%的AI教授是男性，统计数据来自UC伯克利、斯坦福、UIUC、CMU、UC London、牛津和苏黎世联邦理工学院。

美国AI工作岗位的应聘者中71%为男性。

看过这份报告之后，人工智能大牛吴恩达总结了两点：1、AI正在快速发展，不管是学术界还是工业界都是如此。2、AI的发展仍不均衡，在多样性、包容性方面仍需努力。

以下是这份报告的主要内容：

AI论文情况分析

发表总量增长迅猛

从1996年到2017年，CS领域的年发表论文增长了约五倍 (6x) ，AI领域的年发表论文增长了约七倍 (8x) 。对比一下，所有学科的年发表论文总量增长了不到两倍 (<3x) 。

划重点，AI论文的年发表量，比CS论文增长要快。

各地区AI论文发表情况

2017年，Scopus上面的AI论文，有83%来自美国以外的地方。具体数据是，28%来自欧洲，25%来自中国，17%来自美国。

从2007年到2017年，中国的年发表AI论文数增长了150%。

细分领域论文发表情况

2017年发表的AI论文中，有56%来自机器学习与概率推理这一研究方向。

对比一下，2010年发表的AI论文，只有28%来自这个方向。

另外，图表里显示的大部分研究方向，在2014-2017年间，复合年均增长率 (CAGR) 比2010-2014年要高。

比如，神经网络这一方向的论文发表数量，2014-2017年之间，复合年均增长率达到37% (如图中红色曲线) ，最为突出。

做个对比，在2010-2014年之间，神经网络论文发表数，复合年均增长率仅有3%。

arXiv论文

自2010年以来，arXiv论文总体呈现迅速增长，从2010年发布的1,073篇，到2017年发布的13,325篇，增长超过11倍 (12x) 。许多细分领域也呈现增长。

这表示，论文作者们倾向于把自己的研究成果传播出去，不论是经过同行评审还是在AI会议上发表的论文。这也体现了，AI这个领域竞争激烈的特质。

在细分领域中，计算机视觉 (CV) 是自2014年起增长最快的一个 (上图蓝色曲线) ，从1,099篇增长到2017年的4,895篇，涨幅近400%。

AI论文引用量

FWCI是领域权重引用影响系数，可以用来衡量论文的影响力。

报告重新定义了一种“改装版” (Re-based) 的FWCI，不按地区，而按世界平均值，来计算影响力。

在这个标准之下，虽然欧洲发表的AI论文数高于中国和美国，不过论文影响力曲线比较平缓；相比之下，中国发表的论文影响力增长剧烈：与2000年相比，2016年平均每位中国AI论文作者的引用率增长了44%。

不过在这方面，美国依然全球领先，美国AI论文作者的平均引用率，比世界平均值高出83%。

AAAI论文

AAAI 2018，提交论文，中美占70%，中选论文，中美占67%。

中国的论文提交数高出美国约1/3，但二者中选论文数相差无几，中国入选265篇，美国入选268篇。

高校AI课程注册情况

AI和ML进军高校的速度提升了不少。

报告显示，截止到2017年底，AI课程注册人数是2012年的3.4倍，ML课程注册人数是2012年的5倍。

其中，UC伯克利的ML课程的注册人数增长最快，是2012年的6.8倍，但此数值较2016年增长速度有明显下降。

报告进一步统计了非美国地区院校AI+ML课程注册人数的变化。结果显示，清华是非美国院校外增长率最高的高校，几乎是第二名多伦多大学的2倍。

纵向对比来看，清华2017年AI+ML课程注册人数是2010年的16倍。

学术会议热度

在大型会议中，NeurIPS (曾用名NIPS) 、CVPR和ICML，是参与人数最多的三大AI会议。自2012年以来，论参与人数的增长率，这三者也领先于其他会议。

NeurIPS和ICML参与人数增长最快：将2018年与2012年相比，NeuRIPS增长3.8倍 (4.8x) ，ICML增长5.8倍 (6.8x) 。

上面讨论的是大型会议，但小型会议的参与人数同样有明显的增长，甚至可以比大型会议的增长更加明显。

这里最突出的是，ICLR 2018的参会人数达到了2012年的20倍。

原因很可能是近年来，AI领域越来越关注深度学习和强化学习了。

AI创业投资情况

从2015年1月到2018年1月，人工智能创业公司的数量增长到了原来的2.1倍，而所有活跃的创业公司增长到了原来的1.3倍。

大多数情况下，创业公司的增长都保持相对稳定，而人工智能创业公司呈指数级增长。

在风投资金方面，从2013年到2017年，人工智能领域的风投资金增长到了原来的4.5倍，而所有的风投资金只增长到了原来的2.08倍。这些数据都是年度数据，不是逐年累积的。

图表中有两个高峰期，1997-2000年风投资金的激增，对应的是网络泡沫时期。2014-2015年出现了一个较小的增长，因为当时正处于一个相对较大的经济增长时期。

人才需求

报告显示，近几年，社会需要的AI相关人才大幅度增加，目前对有ML技能的人才需求最大，其次是深度学习。

可以看出，ML人才需求也是这两年增长速度最快的。

报告统计，2017年，全球ML人才需求是2015年的35倍，从2016年到2017年的增幅尤为明显。全球对AI人才的需求在2016年骤增。

机器人安装量

2012年到2017年，中国机器人年安装量增长了500%，其他地区，比如韩国和欧洲，分别增长了105%和122%。

在安装量较小的地区中，中国台湾比较突出，在2012-2017年增长最快。

开源框架GitHub标星数

各框架的标星数反映着他们在开发者群体中的流行程度。不过，因为开发者们日常不会“取关”GitHub项目，所以这些星星都是多年来积攒下的。

我们可以明显发现，TensorFlow的受欢迎程度在开发者中遥遥领先、稳步增长。

排除了第一热门，第二名和第三名分别是scikit-learn和BVLC/caffe。

TensorFlow官方力推的keras排到了第四，但近一年来几无增长势头。

另外两大热门PyTorch和MXNet分别排到了第七和第六，尤其是PyTorch，作为一个年轻的框架，自2017年初发布至今，GitHub标星数至少增长了4倍。获取新用户的势头很猛，不知道其中有多少被TensorFlow逼疯的人类。

各类任务最新成绩

这个部分分为CV和NLP两块，分别列举了各主流任务从发展之初到现在的成绩进步情况。

ImageNet图像识别准确率

2017年是ImageNet比赛的最后一届，2018年这项比赛就不再进行了。不过，验证集依然有人在用。

图中，蓝色的线条为ImageNet挑战赛历年的成绩变化，由于每年比赛所用的数据不同，旁边多了一条黄色线条，是以ImageNet 2012验证集为评价标准绘制的。

可以看出，到2015年，机器在图像分类任务上的能力已经明显超越了人眼，而即使比赛不再继续，学术研究者依然在认真推进该任务的表现。

这也侧面说明，如果一项工作有了明确的评价标准和固定的挑战内容，研究者们围绕此竞争，更容易让技术在该领域取得突破。

ImageNet训练速度

这张图是训练ImageNet图像分类神经网络所需时间的历年变化（当然，是买得起足够计算资源的人和机构所用的时长）。

从2017年6月的1小时，到2018年11月的4分钟，ImageNet图像分类神经网络的训练速度提升了16倍，除了硬件方面的贡献，算法上的提升也不容小觑。

图像分割COCO

ImageNet挑战赛“退休”之后，CV领域的朋友们就把重点放在了微软的COCO，挑战语义分割和实例分割。

四年来，COCO数据集上图像分割挑战的精确度已经提升了0.2，2018年的成绩比2015提升了72%。不过，目前还没有超过0.5，这一项还有充足的进步空间。

另外值得一提的是，COCO比赛近年来占据冠军位置的多是来自中国的公司，包括旷视、商汤等计算机视觉独角兽日常包揽数个项目的冠军。

语法分析（Parsing）

在确定句子结构这种语法分析的任务上，2003年到2018年的15年间，AI的表现（F1 Score得分）提升了将近10%。

机器翻译

在机器翻译任务上，报告拿英语-德语互相翻译举例，评估了AI模型在经典机器翻译评估算法BLEU标准中的表现。

报告显示，2018年英语转德语的BLEU评分是2008年的3.5倍，德语转英语成绩是2008年的2.5倍。

机器问答：AI2 Reasoning Challenge(ARC)

在问答领域，AI表现进步更明显，可以按月计数了。

报告统计了2018年从4月到11月间，AI在ARC推理挑战赛上成绩的变化：简单组得分从63%提升到69%，挑战组得分从27%提升到42%。

这些，都仅是半年间的进步。

机器问答：GLUE

同样用于机器问答的GLUE基准（General Language Understanding Evaluation）推出至今只有7个月的时间，但目前的表现已经比半年前提升了90%。

GLUE的推出者、纽约大学助理教授Sam Bowman说，虽然围绕GLUE的大型社区还没有出现，不过已经有了像谷歌BERT这样的代表性技术用了GLUE基准，面世一个月内已经被引用8次。在EMNLP会议中，GLUE时常被讨论，可能会成为语言理解领域中的一个基准线。

注：本文所有图片均来自AI INDEX 2018报告截图，点击“阅读原文”，可在线阅读报告全文。

更多精彩文章：

MIT：近视眼看到会嫉妒，AI在黑暗中视力满分

耶鲁大学：你在偷瞄哪里，AI全知道

为什么越来越多的人喜欢在家宅着？AI表示，你的基因决定了这一切

十年后AI会让我们的生活变得更好吗？三分之一的专家不这么认为……

《自然》子刊：准确率超90%，用手机在家就可以检测HIV！

大家关注的公众号越来越多，找不到“药明康德AI”怎么办？简单四步，将“药明康德AI”设置为星标公众号，问题即可解决。

高三女生醉酒后被强奸致死？检方回应

高三女生醉酒后被强奸致死？检方回应

波罗的海，电缆断裂！

川普的成长秘辛：家庭和大学如何塑造一位“坚刚不可夺其志”的总统

萝莉岛事件背后所隐藏的真相，可能比我们想象的更恐怖

斯坦福全球AI报告：人才需求两年暴增35倍，中国追赶速度惊人

AI论文情况分析

高校AI课程注册情况

学术会议热度

AI创业投资情况

人才需求

机器人安装量

开源框架GitHub标星数

各类任务最新成绩

您可能也对以下帖子感兴趣

高三女生醉酒后被强奸致死？检方回应

高三女生醉酒后被强奸致死？检方回应

波罗的海，电缆断裂！

川普的成长秘辛：家庭和大学如何塑造一位“坚刚不可夺其志”的总统

萝莉岛事件背后所隐藏的真相，可能比我们想象的更恐怖

生成图片，分享到微信朋友圈

斯坦福全球AI报告：人才需求两年暴增35倍，中国追赶速度惊人

AI论文情况分析

高校AI课程注册情况

学术会议热度

AI创业投资情况

人才需求

机器人安装量

开源框架GitHub标星数

各类任务最新成绩

您可能也对以下帖子感兴趣