权威发布:新一代人工智能发展白皮书(2017)
-欢迎入驻全球区块链资产交易交流社区!
来源:机器人大讲堂
指导单位、专家顾问及编写人员
顾 问 潘云鹤(中国工程院院士)
指导单位
工业和信息化部信息化和软件服务业司
指导委员会
谢少锋 工信部信软司司长
李冠宇 工信部信软司副司长
徐晓兰 中国电子学会副理事长兼秘书长
张宏图 中国电子学会总部党委书记兼副秘书长
商 超 工信部信软司软件处处长
傅永宝 工信部信软司软件处调研员
专家委员会(排名不分先后,按姓氏笔画排序)
王士进 科大讯飞研究院副院长
韦 青 微软中国公司首席技术官
宋 波 国安瑞(北京)科技有限公司总经理
刘志坚 京东金融总法律顾问
吴甘沙 驭势科技联合创始人兼CEO
季向阳 清华大学自动化系教授
陈丽娟 阿里巴巴人工智能实验室负责人
梁家恩 云知声信息技术有限公司董事长兼CTO
崔 岩 中德人工智能研究院院长
蔡雄山 腾讯研究院法律研究中心副主任
编写单位
中国电子学会
编写人员
李 颋 周岷峰 马 良 凌 霞
李 岩 张雅妮 许华磊 张 婵
张 力 陈濛萌 樊江洋 朱 毅
李俊平 阎德利 谢中业 陈 岩
报告链接:https://pan.baidu.com/s/1oAn8flo 密码:3gme
编制概要
(一)编制背景
自1956年概念得以确立以来,人工智能发展至今已逾60年,随着所处信息环境和数据基础的深刻变革,开始迈进新一轮发展阶段,呈现出大数据、跨媒体、群体性、自主化、人机融合的发展新特征,从学术牵引式发展迅速转变为需求牵引式发展,相比历史上的任何时刻,都要更加接近于人类智能,既能为进一步掌握城市发展、生态保护、经济管理、金融风险等宏观系统提供指导,也能为设计制造、健康医疗、交通管理、能源节约等微观领域提供解决方案。我国正值工业化、城镇化、信息化、农业现代化的攻坚阶段,迫切需要加快推动人工智能在国民经济社会各行业、各领域的创新应用,促进产业提质增效,改善人民生活水平,切实解决经济运行的重大结构性失衡。针对于此,有必要研究编制新一代人工智能发展白皮书,明确人工智能在新时期、新形势下的技术框架、关键环节、应用前景,为推动人工智能关键技术进步和产业化应用推广提供措施建议,进一步推动我国智能相关的前沿新兴产业持续健康快速发展,有力支撑我国信息化和工业化深度融合迈上新台阶。
(二)编制目标
一是明确新一代人工智能的主要发展方向,系统归纳其主要驱动因素及最具典型意义的特征。
二是研究新一代人工智能的技术框架,梳理技术演进轨迹,提出基础性、通用性技术体系。
三是探索新一代人工智能的产业边界,划分产业类别和应用场景,研判相关的投融资特征及趋势。
四是提出促进新一代人工智能及相关技术及产业发展的可行性措施建议,为相关行业主管部门提供决策参考,为行业健康有序发展提供指导依据。
(三)编制方法
一是研究学习国内外相关战略政策文件,充分借鉴参考国内外主要研究动态和成果。主要包括:美国白宫发布的《为人工智能的未来做好准备》、《国家人工智能研究与发展战略规划》;英国下议院科学和技术委员会发布的《机器人和人工智能》、英国政府科学办公室发布的《人工智能对未来决策的机会和影响》,以及英国政府在2017年1月宣布的《现代工业战略》和3月公布的《数字战略》;日本政府制定的《人工智能产业化路线图》;我国出台的《国务院关于积极推进“互联网+”行动的指导意见》和《“十三五”国家战略性新兴产业发展规划》中关于人工智能的部分。同时,针对欧盟的“人脑项目”、德国的“智慧数据项目”、日本的“超智能社会”和“高级综合智能平台计划”进行了学习了解。
二是访谈国内知名专家学者,围绕新一代人工智能的内涵、外延及特征趋势展开充分研讨。新一代人工智能既有创新性又有继承性,与过往所谈论的人工智能既有联系又有区别,在研究内容上既要有突破又要有充分吸收和借鉴。通过与国内人工智能相关领域的知名院士、高校学者、行业专家的座谈交流,尤其是围绕中国工程院潘云鹤院士《人工智能迈向2.0》一文进行的深入学习研讨,为白皮书的编制奠定了系统的理论基础。
三是调研国内外知名人工智能企业,汇集整理和分析来自实践应用的典型案例。高度重视人工智能领域的具体产品、服务及解决方案提供方式,走进国内外一批在技术或产业方面具备领先水平和特色优势的人工智能企业展开深度调研,并邀请部分企业的技术或战略负责人共同参与了白皮书的编制工作。
(四)特别声明
1、研究主题充分考虑了与国家规划的互动和呼应
人工智能的概念从诞生之日开始计算,已经超过60年,并非横空出世的新兴事物。只不过受近年来算法模式持续优化、数据信息海量增长、运算力大幅提升的影响和带动,表现出了不同以往的发展水平和特征。本白皮书一开始研究主题名为“人工智能2.0”,目前已更改为“新一代人工智能”,是为了呼应院士研究文章、部委领导讲话,以及即将出台的国家级规划,重点针对人工智能的新趋势、新特征、新模式展开研究,并非是要提出一个全新的研究对象。
2、研究范围聚焦技术和产业发展
在人工智能领域,正孕育着堪与相对论、量子理论、计算机、互联网相提并论的重大创新、变革及突破。人工智能历史性地站在了时代的风口,将对人类经济社会发展带来智能化浪潮的颠覆性猛烈冲击。研究人工智能,就要研究其在人类生产生活中的详细地位和作用,涉及到方方面面,包括了道德、法律、伦理、文化等领域。本白皮书的编制,主要是为了给相关行业主管部门和企业提供决策参考依据,集中在技术和产业两大层面展开研究,暂未涉及其他方面。
3、研究内容仍有待进一步丰富完善
当前,各类研究咨询机构纷纷推出围绕人工智能主题的相关报告,各自观点既有一致性,也存在部分不同意见。本白皮书的主要观点和内容仅代表编制组在目前对人工智能的研判和思考,欢迎各方专家学者和企业代表提出宝贵意见,共同推动白皮书的及时更新和纠偏。同时,随着人工智能技术的进步、产业的发展、模式的变革,白皮书的内容将得到进一步丰富完善。
第一章 新一代人工智能研究综述
人工智能发轫于1956年在美国达特茅斯(Dartmouth)学院举行的“人工智能(Artificial Intelligent,简称AI)夏季研讨会”,在20世纪50年代末和80年代初先后步入两次发展高峰,但因为技术瓶颈、应用成本等局限性而均落入低谷。当前,在新一代信息技术的引领下,数据快速积累,运算能力大幅提升,算法模型持续演进,行业应用快速兴起,人工智能发展环境发生了深刻变化,跨媒体智能、群体智能、自主智能系统、混合型智能成为新的发展方向,人工智能第三次站在了科技发展的浪潮之巅。
(一)人工智能简要发展历程
从诞生至今,人工智能已有60年的发展历史,大致经历了三次浪潮。第一次浪潮为20世纪50年代末至20世纪80年代初;第二次浪潮为20世纪80年代初至20世纪末;第三次浪潮为21世纪初至今。在人工智能的前两次浪潮当中,由于技术未能实现突破性进展,相关应用始终难以达到预期效果,无法支撑起大规模商业化应用,最终在经历过两次高潮与低谷之后,人工智能归于沉寂。随着信息技术快速发展和互联网快速普及,以2006年深度学习模型的提出为标志,人工智能迎来第三次高速成长。
图1 人工智能发展历程示意图
资料来源:中国电子学会整理
1、第一次浪潮:人工智能诞生并快速发展,但技术瓶颈难以突破
符号主义盛行,人工智能快速发展。1956年到1974年是人工智能发展的第一个黄金时期。科学家将符号方法引入统计方法中进行语义处理,出现了基于知识的方法,人机交互开始成为可能。科学家发明了多种具有重大影响的算法,如深度学习模型的雏形贝尔曼公式。除在算法和方法论方面取得了新进展,科学家们还制作出具有初步智能的机器。如能证明应用题的机器STUDENT(1964),可以实现简单人机对话的机器ELIZA(1966)。人工智能发展速度迅猛,以至于研究者普遍认为人工智能代替人类只是时间问题。
模型存在局限,人工智能步入低谷。1974年到1980年。人工智能的瓶颈逐渐显现,逻辑证明器、感知器、增强学习只能完成指定的工作,对于超出范围的任务则无法应对,智能水平较为低级,局限性较为突出。造成这种局限的原因主要体现在两个方面:一是人工智能所基于的数学模型和数学手段被发现具有一定的缺陷;二是很多计算的复杂度呈指数级增长,依据现有算法无法完成计算任务。先天的缺陷是人工智能在早期发展过程中遇到的瓶颈,研发机构对人工智能的热情逐渐冷却,对人工智能的资助也相应被缩减或取消,人工智能第一次步入低谷。
2、第二次浪潮:模型突破带动初步产业化,但推广应用存在成本障
数学模型实现重大突破,专家系统得以应用。进入20世纪80年代,人工智能再次回到了公众的视野当中。人工智能相关的数学模型取得了一系列重大发明成果,其中包括著名的多层神经网络(1986)和BP反向传播算法(1986)等,这进一步催生了能与人类下象棋的高度智能机器(1989)。其它成果包括通过人工智能网络来实现能自动识别信封上邮政编码的机器,精度可达99%以上,已经超过普通人的水平。与此同时,卡耐基·梅隆大学为DEC公司制造出了专家系统(1980),这个专家系统可帮助DEC公司每年节约4000万美元左右的费用,特别是在决策方面能提供有价值的内容。受此鼓励,很多国家包括日本、美国都再次投入巨资开发所谓第5代计算机(1982),当时叫做人工智能计算机。
成本高且难维护,人工智能再次步入低谷。为推动人工智能的发展,研究者设计了LISP语言,并针对该语言研制了Lisp计算机。该机型指令执行效率比通用型计算机更高,但价格昂贵且难以维护,始终难以大范围推广普及。与此同时,在1987年到1993年间,苹果和IBM公司开始推广第一代台式机,随着性能不断提升和销售价格的不断降低,这些个人电脑逐渐在消费市场上占据了优势,越来越多的计算机走入个人家庭,价格昂贵的Lisp计算机由于古老陈旧且难以维护逐渐被市场淘汰,专家系统逐也渐淡出人们的视野,人工智能硬件市场出现明显萎缩。同时,政府经费开始下降,人工智能又一次步入低谷。
3、第三次浪潮:信息时代催生新一代人工智能,但未来发展存在诸多隐忧
新兴技术快速涌现,人工智能发展进入新阶段。随着互联网的普及、传感器的泛在、大数据的涌现、电子商务的发展、信息社区的兴起,数据和知识在人类社会、物理空间和信息空间之间交叉融合、相互作用,人工智能发展所处信息环境和数据基础发生了巨大而深刻的变化,这些变化构成了驱动人工智能走向新阶段的外在动力。与此同时,人工智能的目标和理念出现重要调整,科学基础和实现载体取得新的突破,类脑计算、深度学习、强化学习等一系列的技术萌芽也预示着内在动力的成长,人工智能的发展已经进入一个新的阶段。
人工智能水平快速提升,人类面临潜在隐患。得益于数据量的快速增长、计算能力的大幅提升以及机器学习算法的持续优化,新一代人工智能在某些给定任务中已经展现出达到或超越人类的工作能力,并逐渐从专用型智能向通用型智能过渡,有望发展为抽象型智能。随着应用范围的不断拓展,人工智能与人类生产生活联系的愈发紧密,一方面给人们带来诸多便利,另一方面也产生了一些潜在问题:一是加速机器换人,结构性失业可能更为严重;二是隐私保护成为难点,数据拥有权、隐私权、许可权等界定存在困难。
(二)新一代人工智能的主要驱动因素
当前,随着移动互联网、大数据、云计算等新一代信息技术的加速迭代演进,人类社会与物理世界的二元结构正在进阶到人类社会、信息空间和物理世界的三元结构,人与人、机器与机器、人与机器的交流互动愈加频繁。人工智能发展所处的信息环境和数据基础发生了深刻变化,愈加海量化的数据,持续提升的运算力,不断优化的算法模型,结合多种场景的新应用已构成相对完整的闭环,成为推动新一代人工智能发展的四大要素。
图2 新一代人工智能主要驱动因素示意图
资料来源:中国电子学会整理
1、人机物互联互通成趋势,数据量呈现爆炸性增长
近年来,得益于互联网、社交媒体、移动设备和传感器的大量普及,全球产生并存储的数据量急剧增加,为通过深度学习的方法来训练人工智能提供了良好的土壤。目前,全球数据总量每年都以倍增的速度增长,预计到2020年将达到44万亿GB,中国产生的数据量将占全球数据总量的近20%。海量的数据将为人工智能算法模型提供源源不断的素材,人工智能正从监督式学习向无监督学习演进升级,从各行业、各领域的海量数据中积累经验、发现规律、持续提升。
2、数据处理技术加速演进,运算能力实现大幅提升
人工智能领域富集了海量数据,传统的数据处理技术难以满足高强度、高频次的处理需求。人工智能芯片的出现加速了深层神经网络的训练迭代速度,让大规模的数据处理效率显著提升,极大地促进了人工智能行业的发展。目前,出现了GPU、NPU、FPGA和各种各样的AI-PU专用芯片。相比传统的CPU只能同时做一两个加减法运算,NPU等专用芯片多采用“数据驱动并行计算”的架构,特别擅长处理视频、图像类的海量多媒体数据。在具有更高线性代数运算效率的同时,只产生比CPU更低的功耗。
3、深度学习研究成果卓著,带动算法模型持续优化
2006年,加拿大多伦多大学教授杰弗里·辛顿提出了深度学习的概念,极大地发展了人工神经网络算法,提高了机器自学习的能力,例如谷歌大脑团队在2012年通过使用深度学习技术,成功让电脑从视频中“认出”了猫。随着算法模型的重要性进一步凸显,全球科技巨头纷纷加大了这方面的布局力度和投入,通过成立实验室,开源算法框架,打造生态体系等方式推动算法模型的优化和创新。目前,深度学习等算法已经广泛应用在自然语言处理、语音处理以及计算机视觉等领域,并在某些特定领域取得了突破性进展,从有监督式学习演化为半监督式、无监督式学习。
4、资本与技术深度耦合,助推行业应用快速兴起
当前,在技术突破和应用需求的双重驱动下,人工智能技术已走出实验室,加速向产业各个领域渗透,产业化水平大幅提升。在此过程中,资本作为产业发展的加速器发挥了重要的作用,一方面,跨国科技巨头以资本为杠杆,展开投资并购活动,得以不断完善产业链布局,另一方面,各类资本对初创型企业的支持,使得优秀的技术型公司迅速脱颖而出。据美国技术研究公司Venture Scanner的调查报告显示,截至到2017年12月,全球范围内总计2075家与人工智能技术有关公司的融资总额达到65亿美元。同时,美国行业研究公司CB Insight公布了对美国人工智能初创企业的调查结果,这类企业的融资金额约是2012年的10倍。目前,人工智能已在智能机器人、无人机、金融、医疗、安防、驾驶、搜索、教育等领域得到了较为广泛的应用。
(三)新一代人工智能主要发展特征
在数据、运算能力、算法模型、多元应用的共同驱动下,人工智能的定义正从用计算机模拟人类智能演进到协助引导提升人类智能,通过推动机器、人与网络相互连接融合,更为密切地融入人类生产生活,从辅助性设备和工具进化为协同互动的助手和伙伴。主要特征如下:
图3 新一代人工智能主要发展特征
资料来源:中国电子学会整理
1、大数据成为人工智能持续快速发展的基石
随着新一代信息技术的快速发展,计算能力、数据处理能力和处理速度实现了大幅提升,机器学习算法快速演进,大数据的价值得以展现。与早期基于推理的人工智能不同,新一代人工智能是由大数据驱动的,通过给定的学习框架,不断根据当前设置及环境信息修改、更新参数,具有高度的自主性。例如,在输入30万张人类对弈棋谱并经过3千万次的自我对弈后,人工智能AlphaGo具备了媲美顶尖棋手的棋力。随着智能终端和传感器的快速普及,海量数据快速累积,基于大数据的人工智能也因此获得了持续快速发展的动力来源。
2、文本、图像、语音等信息实现跨媒体交互
当前,计算机图像识别、语音识别和自然语言处理等技术在准确率及效率方面取得了明显进步,并成功应用在无人驾驶、智能搜索等垂直行业。与此同时,随着互联网、智能终端的不断发展,多媒体数据呈现爆炸式增长,并以网络为载体在用户之间实时、动态传播,文本、图像、语音、视频等信息突破了各自属性的局限,实现跨媒体交互,智能化搜索、个性化推荐的需求进一步释放。未来人工智能将逐步向人类智能靠近,模仿人类综合利用视觉、语言、听觉等感知信息,实现识别、推理、设计、创作、预测等功能。
3、基于网络的群体智能技术开始萌芽
随着互联网、云计算等新一代信息技术的快速应用及普及,大数据不断累积,深度学习及强化学习等算法不断优化,人工智能研究的焦点,已从单纯用计算机模拟人类智能,打造具有感知智能及认知智能的单个智能体,向打造多智能体协同的群体智能转变。群体智能充分体现了“通盘考虑、统筹优化”思想,具有去中心化、自愈性强和信息共享高效等优点,相关的群体智能技术已经开始萌芽并成为研究热点。例如,我国研究开发了固定翼无人机智能集群系统,并于2017年6月实现了119架无人机的集群飞行。
4、自主智能系统成为新兴发展方向
在长期以来的人工智能发展历程中,对仿生学的结合和关注始终是其研究的重要方向,如美国军方曾经研制的机器骡以及各国科研机构研制的一系列人形机器人等。但均受技术水平的制约和应用场景的局限,没有在大规模应用推广方面获得显著突破。当前,随着生产制造智能化改造升级的需求日益凸显,通过嵌入智能系统对现有的机械设备进行改造升级成为更加务实的选择,也是中国制造2025、德国工业4.0、美国工业互联网等国家战略的核心举措。在此引导下,自主智能系统正成为人工智能的重要发展及应用方向。例如,沈阳机床以i5智能机床为核心,打造了若干智能工厂,实现了“设备互联、数据互换、过程互动、产业互融”的智能制造模式。
5、人机协同正在催生新型混合智能形态
人类智能在感知、推理、归纳和学习等方面具有机器智能无法比拟的优势,机器智能则在搜索、计算、存储、优化等方面领先于人类智能,两种智能具有很强的互补性。人与计算机协同,互相取长补短将形成一种新的“1+1>2”的增强型智能,也就是混合智能,这种智能是一种双向闭环系统,既包含人,又包含机器组件。其中人可以接受机器的信息,机器也可以读取人的信号,两者相互作用,互相促进。在此背景下,人工智能的根本目标已经演进为提高人类智力活动能力,更智能地陪伴人类完成复杂多变的任务。
第二章 新一代人工智能技术框架
与早期人工智能相比,新一代人工智能正在全新信息环境、海量数据基础和持续演进、不断丰富的战略目标的引领下,依托于云计算、大数据两大基础平台和机器学习、模式识别和人机交互三大通用技术,以新型计算架构、通用人工智能和开源生态系统为主要导向,持续搭建和完善技术框架体系,不断逼近技术奇点,深刻变革人类生产生活。
(一)新一代人工智能的技术演进
1、从原有的CPU架构,转变为GPU并行运算架构
深度学习算法运行于CPU架构的指令需求过于复杂。机器学习领域的泰斗杰弗里·辛顿开启了深度学习在人工智能领域研究的浪潮,大数据技术带来的数据洪流满足了深度学习算法对于训练数据量的要求,但是算法的实现还需要更快更强大的处理器予以支撑。传统的主流CPU架构如X86、ARM等往往需要数百甚至上千条指令才能完成一个神经元的处理,对于并不需要太多的程序指令,却需要海量数据运算的深度学习的计算需求,并不能很好地匹配与适应。
GPU架构具备与深度学习相匹配的并行运算能力。GPU(图形处理器)最初是个人电脑、工作站、游戏机和一些移动设备上运行绘图运算工作的微处理器,可以快速处理图像上的每一个像素点,其海量数据并行运算的能力与深度学习需求非常符合。当前主流的CPU只有4核或者8核,可以模拟出12个处理线程来进行运算,但是普通级别的GPU就包含了成百上千个处理单元,高端的甚至更多,这对于多媒体计算中大量的重复处理过程有着天生的优势。吴恩达教授领导的谷歌大脑研究工作结果表明,12颗英伟达(Nvidia)公司的GPU可以提供相当于2000颗CPU的深度学习性能,为技术的发展带来了实质性飞跃,被广泛应用于全球各大主流深度学习开发机构与研究院所。
2、从单一算法驱动,转变为数据、运算力、算法复合驱动
缺少数据支撑与运算力保证的算法驱动模式难以持续发展。人工智能发展以实现计算智能为重要研究方向,充分利用现代高性能计算机的快速计算和记忆存储能力,设计出神经计算、模糊计算和进化计算等求解算法,解决优化筛选、单点搜索、逻辑推理等实际应用问题。尽管深度学习概念和浅层学习算法已经被提出多年,但是一直进展缓慢,究其原因是缺乏海量的数据积累和与之相匹配的高水平计算能力,无法对算法模型进行持续的改进与优化,只停留在理论研究阶段,距离实际应用存在不小的差距。
数据、运算力和算法复合驱动模式引发人工智能爆发式增长。与早期人工智能相比,新一代人工智能体现出数据、运算力和算法相互融合、优势互补的良好特点。数据方面,人类进入互联网时代后,数据技术高速发展,各类数据资源不断积累,为人工智能的训练学习过程奠定了良好的基础。运算力方面,摩尔定律仍在持续发挥效用,计算系统的硬件性能逐年提升,云计算、并行计算、网格计算等新型计算方式的出现拓展了现代计算机性能,获得更快的计算速度。算法方面,伴随着深度学习技术的不断成熟,运算模型日益优化,智能算法不断更新,提升了模型辨识解析的准确度。
3、从封闭的单机系统,转变为快捷灵活的开源框架
专家系统本地化特性限制了人工智能发展步伐。以往的人工智能专家系统是基于本地化专业知识进行设计开发,以知识库和推理机为中心而展开,推理机设计内容由不同的专家系统应用环境决定,单独设定模型函数与运算机制,一般不具备通用性。同时,知识库是开发者收集录入的专家分析模型与案例的资源集合,只能够在单机系统环境下使用且无法连接网络,升级更新较为不便。
开源框架推动构建人工智能行业解决方案。人工智能系统的开发工具日益成熟,通用性较强且各具特色的开源框架不断涌现,如谷歌的TensorFlow、Facebook的Torchnet、百度的PaddlePaddle等,其共同特点均是基于Linux生态系统,具备分布式深度学习数据库和商业级即插即用功能,能够在GPU上较好地继承Hadoop和Spark架构,广泛支持Python、Java、Scala、R等流行开发语言,与硬件结合生成各种应用场景下的人工智能系统与解决方案。
4、从学术研究探索导向,转变为快速迭代的实践应用导向
学术导向难以满足复杂数据信息背景下的创新需求。随着人工智能的不断发展,分化产生了不同的学术流派,以符号主义、联结主义、进化主义、贝叶斯学派、类推学派等为典型。不同学派按照各自对人工智能领域基本理论、研究方法和技术路线的理解,以学术研究为目的进行探索实践,一定程度上推动了人工智能理论与技术的发展。在如今数据环境改变和信息环境变化的背景下,现实世界结构趋向复杂,单纯依靠课题立项和学术研究无法持续推动人工智能满足当前现实世界的模拟与互动需求,快速变化的应用环境也容易导致理论研究与实际应用相脱节,影响人工智能技术对经济发展和社会进步的积极拉动作用。
快速迭代的实践应用导向加速形成技术发展正循环。目前,人工智能围绕医疗、金融、交通、教育、零售等数据较集中且质量较高的行业的实践需求,在算法模型、图像识别、自然语言处理等方面将持续出现迭代式的技术突破,在深度应用中支撑人工智能实现“数据-技术-产品-用户”的往复正循环,由学术驱动向应用拉动转化。在人工智能技术准备期,由于提供数据支撑较少,技术提升度慢,一旦进入应用期,大量的优质数据有助于分析技术弊端,通过对相关技术进行改进升级,提升了产品的应用水平,用户在得到更好的产品体验后,继续为应用平台创造了更大规模的后台数据,用来进行下一步的技术升级与产品改良,由此进入了大规模应用阶段。在技术快速迭代发展的过程中,数据累积和大规模应用起到了至关重要的作用,能够持续推动人工智能技术实现自我超越。
(二)新一代人工智能技术体系
新一代人工智能技术体系由基础技术平台和通用技术体系构成,其中基础技术平台包括云计算平台与大数据平台,通用技术体系包括机器学习、模式识别与人机交互。在此技术体系的基础上,人工智能技术不断创新发展,应用场景和典型产品不断涌现。
1、云计算:基础的资源整合交互平台
云计算主要共性技术包括虚拟化技术、分布式技术、计算管理技术、云平台技术和云安全技术,具备实现资源快速部署和服务获取、进行动态可伸缩扩展及供给、面向海量信息快速有序化处理、可靠性高、容错能力强等特点,为人工智能的发展提供了资源整合交互的基础平台。尤其与大数据技术结合,为当前受到最多关注的深度学习技术搭建了强大的存储和运算体系架构,促进了神经网络模型训练优化过程,显著提高语音、图片、文本等辨识对象的识别率。
表1 云计算主要共性技术
资料来源:中国电子学会整理
2、大数据:提供丰富的分析、训练与应用资源
大数据主要共性技术包括采集与预处理、存储与管理、计算模式与系统、分析与挖掘、可视化计算及隐私及安全等,具备数据规模不断扩大、种类繁多、产生速度快、处理能力要求高、时效性强、可靠性要求严格、价值大但密度较低等特点,为人工智能提供丰富的数据积累和价值规律,引发分析需求。同时,从跟踪静态数据到结合动态数据,可以推动人工智能根据客观环境变化进行相应的改变和适应,持续提高算法的准确性与可靠性。
表2 大数据主要共性技术
3、机器学习:持续引导机器智能水平提升
机器学习指通过数据和算法在机器上训练模型,并利用模型进行分析决策与行为预测的过程。机器学习技术体系主要包括监督学习和无监督学习,目前广泛应用在专家系统、认知模拟、数据挖掘、图像识别、故障诊断、自然语言理解、机器人和博弈等领域。机器学习作为人工智能最为重要的通用技术,未来将持续引导机器获取新的知识与技能,重新组织整合已有知识结构,有效提升机器智能化水平,不断完善机器服务决策能力。
表3 机器学习主要共性技术
资料来源:中国电子学会整理
4、模式识别:从感知环境和行为到基于认知的决策
模式识别是对各类目标信息进行处理分析,进而完成描述、辨认、分类和解释的过程。模式识别技术体系包括决策理论、句法分析和统计模式等,目前广泛应用在语音识别、指纹识别、人脸识别、手势识别、文字识别、遥感和医学诊断等领域。随着理论基础和实际应用研究范围的不断扩大,模式识别技术将与人工神经网络相结合,由目前单纯的环境感知进化为认知决策,同时量子计算技术也将用于未来模式识别研究工作,助力模式识别技术突破与应用领域拓展。
表4 模式识别主要共性技术
资料来源:中国电子学会整理
5、人机交互:支撑实现人机物交叉融合与协同互动
人机交互技术赋予机器通过输出或显示设备对外提供有关信息的能力,同时可以让用户通过输入设备向机器传输反馈信息达到交互目的。人机交互技术体系包括交互设计、可用性分析评估、多通道交互、群件、移动计算等,目前广泛应用在地理空间跟踪、动作识别、触觉交互、眼动跟踪、脑电波识别等领域。随着交互方式的不断丰富以及物联网技术的快速发展,未来肢体识别和生物识别技术将逐渐取代现有的触控和密码系统,人机融合将向人机物交叉融合进化发展,带来信息技术领域的深刻变革。
表5 人机交互主要共性技术
资料来源:中国电子学会整理
(三)国内外技术对比分析
1、发达国家基础平台布局完善,国内仍缺乏自主核心技术
国外企业技术领先且大量布局公有云业务领域,大数据业务经验成熟、分工明确且数据开放程度较高。云计算方面,国外云计算企业基础技术相对领先,服务器虚拟化、网络技术(SDN)、存储技术、分布式计算、OS、开发语言和平台等核心技术基本上都掌握在少数国外公司手中,凭借着强大的创新和资本转化能力,有能力支持技术不断推陈出新。同时,国外企业在细分领域都有所布局,形成了完善的产业链配合,提供各种解决方案的集成,可以满足多场景使用要求。大数据方面,国外公司在大数据技术各个领域方面分工明确,有的专注于数据挖掘,有的专注于数据清洗,也有的专注于数据存储与管理。同时,国外从事大数据技术研发的企业有很大一部分是由传统的数据公司转型而来,如IBM、甲骨文(Oracle)、易安信(EMC,2015年10月被戴尔公司收购)等,这类公司在大数据概念兴起之前就早已充分接触数据领域业务,在数据科学领域有较强的研发能力。国外数据保护制度相对完善,数据开放标准成熟,为大数据技术研发提供了良好的外部环境。
国内企业自主核心技术有待提高,数据开放程度偏低且缺乏必要的保护。云计算方面,国内虽然有阿里、华为、新华三、易华录等一批科技公司大力投入研发资源,但核心技术积累依然不足,难以主导产业链发展。大数据方面,国内企业仍处于“跟风”国外企业的发展阶段,在数据服务内核等方面缺乏积淀与经验,未能完全实现从IT领域向DT(数据技术)领域的转型。同时,国内数据应用环境相对封闭,政府公共数据开放程度较低,数据安全保护等级有待提高,数据安全风险评估制度与保障体系有待完善,对大数据技术的升级发展形成了一定的限制因素。
2、发达国家在机器学习和人机交互领域具备先发优势,国内企业存在技术差距与人才短板
国外机构发力机器学习主流开源框架,积极开发人机交互下一代新型技术。机器学习方面,目前较为流行的开源框架基本都为国外公司或机构所开发,例如TensorFlow、Torchnet、Caffe、DMTK、SystemML等,同时注重大数据、云计算等基础支撑信息技术对机器学习研究的促进作用,以及机器学习的应用实践,已进入研发稳定阶段。人机交互方面,国外技术企业基于触控技术、可穿戴设备、物联网和车联网的发展基础,正在积极开发性价比更高的下一代人机交互新型技术,以对现有产品进行升级并降低成本。
国内机器学习基础理论体系尚不成熟,缺乏人机交互专业领域人才培养环境。机器学习方面,尽管国内学者在数据挖掘层面取得了一定的研究成绩,但对于机器学习的底层技术、实现原理及应用方法缺乏足够的重视,导致关键技术环节缺失与重要领域边缘化,不利于在国际主流机器学习技术角逐中展开有效竞争。人机交互方面,研究者需要具备数学、计算机学和心理学等相关背景,复合型较强,相比于国外高校都设立单独的人机交互专业,国内高校开设的专业相对传统,缺乏交叉复合型人才的培养机制,亟需建立人机交互领域技术人才培养的良好环境。
3、国内外模式识别研究水平基本处于同一起跑线,重点聚焦于语音识别与图像识别
国内外研究领域基本一致,围绕前沿技术领域开展持续创新。目前,国内外企业均在围绕模式识别领域的基础理论、图像处理、计算机视觉以及语音信息处理展开集中研究,探索模式识别机理以及有效计算方法,为解决应用实践问题提供关键技术。国外科技公司在模式识别各领域拥有多年的技术积累,深入语音合成、生物认证分析、计算机视觉等前沿技术领域,具备原创性技术突破能力;国内企业在模式识别前沿技术研发方面与国外同行处于并跑状态,除百度、讯飞等行业龙头外,众多初创公司也加入了模式识别研究的技术与应用创新,催生了一批有创意的新型产品。
语音识别和图像识别准确率明显提升,国内企业中文语音识别技术相对领先。国内外企业均致力于提高语音识别和图像识别准确率,谷歌和微软分别表示旗下的语音识别产品技术出错率已降至8%和6.3%,微软研究院开发的图像识别系统在世界著名的图片识别竞赛ImageNet中获得多个类别评比的第一名,为下一步的商业化应用奠定了良好基础。同时,国内企业重点突破中文语音识别技术,搜狗、百度和科大讯飞三家公司各自宣布旗下的中文语音产品识别准确率达到了97%,处于业内领先水平。
第三章 新一代人工智能的产业化应用
(一)新一代人工智能的产业边界
一般认为,人工智能是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的科学。迄今为止,出现了机器定理证明、机器翻译、专家系统、机器学习、机器人与智能控制等一系列研究成果。随着人工智能理论和技术的日益成熟,应用范围不断扩大,既包括城市发展、生态保护、经济管理、金融风险等宏观层面,也包括工业生产、医疗卫生、交通出行、能源利用等具体领域。专门从事人工智能产品研发、生产及服务的企业迅速成长,真正意义上的人工智能产业正在逐步形成、不断丰富,相应的商业模式也在持续演进和多元化。
目前,对人工智能的认识相对较为统一,但人工智能产业的概念有待进一步明确,对人工智能的核心产业和人工智能带动的相关产业也需要进行有效区分。我们认为,可以将围绕人工智能技术及衍生出的主要应用形成的具有一定需求规模、商业模式较为清晰可行的行业集合,视为人工智能在当前的核心产业,也即本报告所关注的主体。随着潜在需求的逐渐明确和商业模式的日渐成熟,人工智能核心产业的边界与范围将逐步扩展。而通过人工智能核心产业发展所形成的辐射和扩散效应,获得新提升、新增长的国民经济其它行业集合,均可视为人工智能带动的相关产业。
通过梳理从研发到应用所涉及的产业链各个环节,我们进一步将新一代人工智能在当前的核心产业分为基础层、技术层和应用层,结合目前常见应用场景,依据产业链上下游关系,再将其主要划分为既相对独立又相互依存的若干种产品及服务,如下图所示。
图4 新一代人工智能当前核心产业链
资料来源:中国电子学会整理
2017年,全球人工智能核心产业规模已超过370亿美元。其中,我国人工智能核心产业规模已达到56亿美元左右。在下一阶段,得益于技术持续进步和商业模式不断完善,全球人工智能市场需求将进一步快速释放,带动2020年全球人工智能核心产业规模超过1300亿美元,年均增速达到60%;其中,我国人工智能核心产业规模将超过220亿美元,年均增速接近65%。
图5 全球人工智能核心产业规模及年增长率
图6 我国人工智能核心产业规模及年增长率
资料来源:中国电子学会整理
(二)基础层
基础层主要包括智能传感器、智能芯片、算法模型,其中,智能传感器和智能芯片属于基础硬件,算法模型属于核心软件。随着应用场景的快速铺开,既有的人工智能产业在规模和技术水平方面均与持续增长的市场需求尚有差距,倒逼相关企业及科研院所进一步加强对智能传感器、智能芯片及算法模型的研发及产业化力度。预计到2020年,全球智能传感器、智能芯片、算法模型的产业规模将突破270亿美元,我国智能传感器、智能芯片、算法模型的产业规模将突破44亿美元。
图7 2020年全球及我国人工智能基础层各产业规模占比
资料来源:中国电子学会整理
1、智能传感器:智能转型引领行业发展
智能传感器属于人工智能的神经末梢,是实现人工智能的核心组件,是用于全面感知外界环境的最核心元件,各类传感器的大规模部署和应用是实现人工智能不可或缺的基本条件。随着传统产业智能化改造的逐步推进,以及相关新型智能应用和解决方案的兴起,对智能传感器的需求将进一步提升,预计到2020年全球智能传感器的产业规模将超过54亿美元,其中我国智能传感器的产业规模为11亿美元。
核心技术。智能传感器本质上是利用微处理器实现智能处理功能的传感器,必须能够自主接收、分辨外界信号和指令,并能通过模糊逻辑运算、主动鉴别环境,自动调整和补偿适应环境,以便于大幅减轻数据传输频率和强度,显著提高数据采集效率。目前,智能传感器集成化、小型化的特点愈发突出,更多的功能被集成在一起,控制单元所需的外围接插件和分立元件越来越少,促使其通用性更强,应用范围更宽广,制造成本也进一步下降。同时,原子材料、纳米材料等新材料技术也在智能传感器领域得到日益广泛的应用,使其表现出更为灵敏的物理性能。
主要产品。智能传感器已广泛应用于智能机器人、智能制造系统、智能安防、智能人居、智能医疗等各个领域。例如,在智能机器人领域,智能传感器使机器人具有了视觉、听觉和触觉,可感周边环境,完成各种动作,并与人发生互动,包括触觉传感器、视觉传感器、超声波传感器等。在智能制造系统领域,利用智能传感器可直接测量与产品质量有关的温度、压力、流量等指标,利用深度学习等模型进行计算,推断出产品的质量,包括液位、能耗、速度等传感器。在安防、人居、医疗等与人类生活密切相关的领域,智能传感器也广泛搭载于各类智能终端,包括光线传感器、距离传感器、重力传感器、陀螺仪、心律传感器等。
典型企业。智能传感器市场主要由国外厂商占据,集中度相对较高。由于技术基础深厚,国外厂商通常多点布局,产品种类也较为丰富,较为典型的有霍尼韦尔、美国压电、意法半导体、飞思卡尔。如霍尼韦尔生产的产品包括了压力传感器、温度传感器、湿度传感器等多个产品类型,涉及航空航天、交通运输、医疗等多个领域。美国压电生产的产品涵盖了加速度传感器、压力传感器、扭矩传感器等,并涉及核工业、石化、水力、电力、和车辆等多个不同领域。相比之下,我国厂商经营内容仍较为单一,如高德红外主要生产红外热成像仪,华润半导体主要生产光敏半导体,但其中也出现了华工科技、中航电测等少数企业试水扩大布局范围。人工智能根据客观环境变化进行相应的改变和适应,持续提高算法的准确性与可靠性。
表6 主要智能传感器及生产企业
资料来源:中国电子学会整理
2、智能芯片:初创企业蓄势待发
智能芯片是人工智能的核心,与传统芯片最大的差别在于架构不同,传统的计算机芯片均属于冯·诺依曼体系,智能芯片则仿照大脑的结构设计,试图突破冯·诺依曼体系中必须通过总线交换信息的瓶颈。当前各大科技巨头正积极布局人工智能芯片领域,初创企业纷纷入局,随着市场将进一步打开,预计到2020年全球智能芯片的产业规模将接近135亿美元,其中我国智能芯片的产业规模近25亿美元。
核心技术。深度学习已成为当前主流的人工智能算法,这对于处理器芯片的运算能力和功耗提出了更高要求,目前软件企业采取的主流方案是通过应用GPU和FPGA提高运算效率,与CPU少量的逻辑运算单元相比,GPU就是一个庞大的计算矩阵,具有数以千计的计算核心,可实现10-100倍应用吞吐量,而且支持对深度学习至关重要的并行计算能力,可以比传统处理器更加快速,大大加快了训练过程。同时,一些针对深度学习算法而专门优化和设计的芯片也已经面市,由于是量身定制,运行更为高效。
主要产品。数据和运算是深度学习的基础,可以用于通用基础计算且运算速率更快的GPU迅速成为人工智能计算的主流芯片。2015年以来,英伟达公司的GPU得到广泛应用,并行计算变得更快、更便宜、更有效,最终导致人工智能大爆发。同时,与人工智能更匹配的智能芯片体系架构的研发成为人工智能领域的新风口,已有一些公司针对人工智能推出了专用的人工智能芯片。如IBM的类脑芯片TureNorth及神经突触计算机芯片SyNAPSE、高通的认知计算平台Zeroth、英特尔收购的Nervana、浙江大学与杭州电子科技大学的学者合作研制的类脑芯片“达尔文”,中国科学院计算技术研究所的寒武纪芯片。
典型企业。作为核心和底层基础,智能芯片已经成为各大公司布局的重点领域。目前传统芯片巨头如英特尔、英伟达,大型互联网公司如谷歌、微软已经在该领域发力,这些公司资金实力雄厚,除了自行研发外,通常也采用收购的方式快速建立竞争优势。例如,谷歌继2016年发布第一代TPU 后,于今年谷歌I/O大会上推出了第二代深度学习芯片TPU,英特尔则以167亿美元收购FPGA生产商Altera公司。由于智能芯片刚刚兴起,技术、标准都处于探索阶段,我国芯片厂商换道超车的机会窗口闪现,涌现出了一批优秀的创业型公司,如寒武纪、深鉴科技等。
表7 主要智能芯片及生产企业
资料来源:中国电子学会整理
3、算法模型:通过开源构建生态已是大势所趋
人工智能的算法是让机器自我学习的算法,通常可以分为监督学习和无监督学习。随着行业需求进一步具化,及对分析要求进一步的提升,围绕算法模型的研发及优化活动将越发频繁。当前,算法模型产业已初具规模,预计到2020年全球算法模型产业规模将达到82亿美元,我国算法模型产业规模将突破8亿美元。
核心技术。算法创新是推动本轮人工智能大发展的重要驱动力,深度学习、强化学习等技术的出现使得机器智能的水平大为提升。全球科技巨头纷纷以深度学习为核心在算法领域展开布局,谷歌、微软、IBM、Facebook、百度等相继在图片识别、机器翻译、语音识别、决策助手、生物特征识别等领域实现了创新突破。
主要产品。目前,随着大数据环境的日渐形成,全球算法模型持续取得应用进展,深度学习算法成为推动人工智能发展的焦点,各大公司纷纷推出自己的深度学习框架,如谷歌的TensorFlow,IBM的System ML,Facebook的Torchnet,百度公司的PaddlePaddle。更为重要的是,开源已成为这一领域不可逆的趋势,这些科技巨头正着手推动相关算法的开源化,发起算法生态系统的竞争。与此同时,服务化也是算法领域未来发展的重要方向,一些在算法提供商正将算法包装为服务,针对客户的具体需求提供整体解决方案。
典型企业。目前,在算法模型领域具备优势的企业基本均为知名的科技巨头,正在通过构建联盟关系,扩展战略定位等方式布局人工智能产业。2016年9月,Facebook、亚马逊、谷歌Alphabet、IBM和微软自发聚集在一起,宣布缔结新的人工智能伙伴关系,10月,谷歌公司更是调整战略方向从移动优先转变为人工智能优先。我国科技企业也纷纷落子人工智能,2017年3月,阿里巴巴正式推出“NASA”计划,腾讯成立人工智能实验室,5月,百度公司将战略定位从互联网公司变更为人工智能公司,发展人工智能已经成为科技界的共识。
表8 主要算法模型及相关机构
资料来源:中国电子学会整理
(三)技术层
技术层主要包括语音识别、图像视频识别、文本识别等产业,其中语音识别已经延展到了语义识别层面,图像视频识别包括了人脸识别、手势识别、指纹识别等领域,文本识别主要是针对印刷、手写及图像拍摄等各种字符进行辨识。随着全球人工智能基础技术的持续发展与应用领域的不断丰富,人工智能技术层各产业未来将保持快速增长态势。预计到2020年,全球语音识别、图像视频识别、文本识别等人工智能技术层产业规模将达到342亿美元,我国人工智能技术层产业规模将突破66亿美元。
图8 2020年全球及我国人工智能技术层各产业规模占比
资料来源:中国电子学会整理
1、语音识别:正在步入应用拉动的快速增长阶段
语音识别(Speech Recognition,SR)技术是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用及产品。在大数据、移动互联网、云计算以及其他技术的推动下,全球的语音识别产业已经步入应用快速增长期,未来将代入更多实际场景,预计到2020年全球语音识别产业规模将达到236亿美元,国内语音识别产业规模达到44.2亿美元。
核心技术。语音识别的主要目的是让智能设备能够具有和人类一样的听识能力,同时将人类语言所表述的自然语义自动转换为计算机能理解和操作的结构化语义,完成实时的人机交互功能。近年来,语音唤醒技术、声学前端处理技术、声纹识别技术、语义理解技术、对话管理技术等语音识别领域核心技术的蓬勃发展,有助于构建智能语音交互界面系统,提高语音识别的准确率与响应速度,满足垂直领域对自然语义识别和声音指令的应用需求,为用户提供自然、友好和便捷的人机交互体验。
主要产品。伴随着移动互联网技术的发展与智能硬件设备的普及,人类已经不再满足于键盘输入和手写输入等传统人机交互方式,语音识别技术在电子信息、互联网、医疗、教育、办公等各个领域均得到了广泛应用,形成了智能语音输入系统、智能语音助手、智能音箱、车载语音系统、智能语音辅助医疗系统、智能口语评测系统、智能会议系统等产品,可以通过用户的语音指令和谈话内容实现陪伴聊天、文字录入、事务安排、信息查询、身份识别、设备控制、路径导航、会议记录等功能,优化了复杂的工作流程,提供了全新的用户应用体验。
典型企业。语音识别领域具有较高的行业技术壁垒,在全球范围内,只有少数的企业具有竞争实力。目前,Nuance、苹果、三星、微软、谷歌、科大讯飞、云知声、百度、阿里、凌声芯、思必驰等知名企业均重点攻克语音识别技术,推出大量相关产品。Nuance曾经是全球最大的语音识别技术提供商,侧重于为服务提供商提供底层技术解决方案,随着企业战略目标以及商业环境的改变,目前转型为客户端解决方案提供商;苹果公司以Siri语音助手为平台关联iOS系统相关应用与服务,倾向于改善用户的智能手机使用体验和创新商业模式;微软致力于提高语音识别技术的准确率,英语的语音识别转录词错率仅5.9%,达到了专业速录员水平,并将相关技术应用于自身产品“小冰”和“小娜”之中;科大讯飞作为国内智能语音和人工智能产业的领导者,中文语音识别技术已处于世界领先地位,并逐渐建立中文智能语音产业生态;云知声重点构建集机器学习平台、语音认知计算和大数据交互接口三位一体的智能平台,垂直应用领域集中于智能家居和车载系统;阿里人工智能实验室借助“天猫精灵”智能音箱构建基于语音识别的智能人机交互系统,并通过有效接入第三方应用实现生活娱乐功能的进一步拓展。
图9 语音识别主要产品及典型企业
资料来源:中国电子学会整理
2、图像视频识别:在安防监控市场具有巨大增长潜力
图像识别(Image Recognition,IR)技术是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式状态下的目标和对象,包括人脸、手势、指纹等生物特征。视频从工程技术角度可以理解成静态图像的集合,所以视频识别与图像识别的定义和基本原理一致,在识别量和计算量上明显提高。随着人类社会环境感知要求的不断提升和社会安全问题的日益复杂,人脸识别和视频监控作用更加突出,图像视频识别产业未来将迎来爆发式增长,预计到2020年全球图像视频识别产业规模将达到82亿美元,国内图像视频识别产业规模达到15.2亿美元。
核心技术。图像视频识别是通过计算机模拟人类器官和大脑感知辨别外界画面刺激的过程,既要有进入感官的信息,也要有记忆中存储的信息,对存储的信息和接受的信息进行比较加工,完成图像视频的辨识过程。围绕以上特定需求,图像预处理技术、特征提取分类技术、图像匹配算法、相似性对比技术、深度学习技术等构成了图像视频识别的核心技术体系框架,能够对通过计算机输入和照相机及摄像头获取的图片视频进行变换、压缩、增强复原、分割描述等操作,显著提高图像视频识别质量和清晰度,有助于快速准确完成图像视频的响应分析流程。
主要产品。随着工业生产及生活消费领域影像设备的日益普及,每天都会产生海量蕴含丰富价值和信息的图片及视频,单靠人力无法进行分拣处理,需要借助图像视频识别功能进行集中快速获取与解析。目前,智能图片搜索、人脸识别、指纹识别、扫码支付、视觉工业机器人、辅助驾驶等图像视频识别产品正在深刻改变着传统行业,针对种类繁杂、形态多样的图形数据和应用场景,基于系统集成硬件架构和底层算法软件平台定制综合解决方案,面向需求生成图像视频的模型建立与行为识别流程,为用户提供丰富的场景分析功能与环境感知交互体验。
典型企业。近年来,国内外从事图像视频识别的公司显著增加,谷歌、Facebook、微软、旷视科技、图普科技、格灵深瞳等国内外知名企业重点集中在人脸识别、智能安防和智能驾驶等领域进行技术研发与产品设计。国外公司大多进行底层技术研发,同时偏重于整体解决方案的提出,积极建立开源代码生态体系,如谷歌推出Google Lens应用实时识别手机拍摄的物品并提供与之相关的内容,Facebook开源三款智能图片识别软件,鼓励研发者们围绕其图像视频识别技术框架开发各类功能丰富的应用产品;国内企业直接对接细分领域,商业化发展道路较为明确,如旷视科技目前重点研发人脸检测识别技术产品,加强管控卡口综合安检、重点场所管控、小区管控、智慧营区等领域的业务布局,图普科技在阿里云市场提供色情图像和暴恐图像识别的产品和服务,确定准确率超过99.5%,满足了云端用户的安全需求。
表10 图像视频识别主要产品及典型企业
资料来源:中国电子学会整理
3、文本识别:全面进入云端互联时代
文本识别(Text Recognition,TR)技术是指利用计算机自动识别字符,包括文字信息的采集、信息的分析与处理、信息的分类判别等内容。文本识别可以有效提高如征信、文献检索、证件识别等业务的自动化程度,简化工作流程,提高相关行业效率。随着政府、金融、教育、科技等领域需求的进一步上升,文本识别将在工业自动化流程与个人消费领域取得长足发展,预计到2020年全球文本识别产业规模将达到24亿美元,国内文本识别产业规模达到6.6亿美元。
核心技术。文本识别技术目前正由嵌入式设备本地化处理向云端在线处理全面演进发展,过去由鼠标与键盘输入的文本信息,现在则主要由摄像头、麦克风和触摸屏采集获取。在此基础上,以往的文本识别核心技术,如模版匹配技术、字符分割技术、光学字符识别技术(Optical Character Recognition,OCR)、逻辑句法判断技术等需要与应用程序编程接口(API)技术、智能终端算法技术、云计算技术等结合,衍生出面向云端与移动互联网的新型文本识别系统,通过开放的平台与服务为广大的企业及个人用户提供方便快捷的服务。
主要产品。当今信息社会背景下,文本信息不仅体量巨大,表现形式也日趋复杂,包括印刷体、手写体以及通过外接设备输入到计算机系统的字符图形。同时,随着世界不同语言文明地区交流逐渐增多,对实时语言文本翻译系统的需求更加强烈。目前,基于文本识别技术开发的文件扫描、名片识别、身份证信息提取、文本翻译、在线阅卷、公式识别等产品正在金融、安防、教育、外交等领域得到广泛应用,通过不同的授权级别,为企业级用户部署专业的文档管理、移动办公与信息录入基础设施,同时为个人用户提供个性化的人脉建立、信息咨询和远程教育服务。
典型企业。随着文本识别在各类垂直应用领域的应用逐渐普及,国内外企业也结合自身业务和区域发展特色积极展开布局。谷歌、微软、亚马逊等跨国科技巨头在自身产品服务中内嵌文本识别技术,以增强产品使用体验和用户粘度,如谷歌推出的在线翻译系统可提供80种语言之间的即时翻译,并将自身的语音识别技术与文本识别相结合,提高了翻译效率。国内公司在中文文本识别领域也有多年积累,具备良好的技术优势与产业背景,汉王科技、百度、腾讯等均有较为成熟的产品推出,如汉王正在构建以识别云和设备云为核心的文本识别2.0系统。
表11 文本识别主要产品及典型企业
资料来源:中国电子学会整理
(四)应用层
应用层主要包括智能机器人、智能金融、智能医疗、智能安防、智能驾驶、智能搜索、智能教育、智能制造系统及智能人居等产业。其中,智能机器人产业规模及增速相对突出;智能金融、智能驾驶、智能教育的用户需求相对明确且市场已步入快速增长阶段;智能安防集中于行业应用和政府采购,市场集中度相对较高;智能搜索、智能人居的产品尚未完善,市场正在逐步培育;智能医疗则涉及审批机制,市场尚未放量。预计到2020年,全球人工智能应用层产业规模将达到672亿美元,其中,智能机器人、智能驾驶、智能教育、智能安防及智能金融的产业规模将超过68%,同时我国人工智能应用层产业规模将突破110亿美元。
图9 2020年全球及我国人工智能应用层各产业规模占比
1、智能机器人
智能机器人是指具备不同程度类人智能,可实现“感知-决策-行为-反馈”闭环工作流程,可协助人类生产、服务人类生活,可自动执行工作的各类机器装置,主要包括智能工业机器人、智能服务机器人和智能特种机器人。受智能工业机器人助推智能制造升级和智能家用服务机器人率先放量的带动,智能机器人全球产业规模在2020年会接近90亿美元,我国将达到25亿美元。
核心技术。由于高频人机互动特点,智能机器人的核心技术重点聚焦在智能感知、智能认知和多模态人机交互领域。同时依据应用领域的不同,智能机器人也存在着大量带有典型行业特征的特色关键技术。智能工业机器人运用传感技术和机器视觉技术,具备触觉和简单的视觉系统,更进一步运用人机协作、多模式网络化交互、自主编程等技术增加自适应、自学习功能,引导工业机器人完成定位、检测、识别等更为复杂的工作,替代人工视觉运用于不适合人工作业的危险工作环境或人工视觉难以满足要求的场合;智能家用服务机器人重点应用移动定位技术和智能交互技术,达到服务范围全覆盖及家用陪护的目的;智能医疗服务机器人重点突破介入感知建模、微纳技术和生肌电一体化技术,以达到提升手术精度、加速患者康复的目的;智能公共服务机器人重点运用智能感知认知技术、多模态人机交互技术、机械控制和移动定位技术等,实现应用场景的标准化功能的呈现和完成;智能特种机器人运用仿生材料结构、复杂环境动力学控制、微纳系统等前沿技术,替代人类完成高危环境和特种工况作业。
主要产品。智能工业机器人领域,随着柔性生产模式的转型,具备感知、规划、学习能力的智能定位机器人和智能检测机器人加速出现,智能定位机器人通过机器视觉系统结合双目摄像头,引导机械手进行准确的定位和运动控制,不仅可以完成对工件的抓取和放置等操作,同时还能进行焊缝、抛光、喷涂、外壳平整等多项作业;智能检测机器人用机器视觉检测方法大大提高生产效率和生产的自动化程度。智能服务机器人领域,随着人均收入水平的提升,对家用工具智能化程度的需求日益增长,扫地机器人、擦窗机器人等智能家政服务产品大量涌现;同时由于全球老龄化引发的社会问题,情感陪护类机器人市场需求也逐步成熟,辅助人类进行陪伴和沟通;随着全球医疗投入的持续增加以及微创类手术需求的快速上升,智能医疗服务机器人进一步促进了医疗解决方案的高效化和精准化。智能特种机器人领域,人类工作及探索的环境边界不断拓展,为降低在高危及不确定环境的工作难度,智能军用机器人、应急救援机器人及消防机器人等正在逐渐代替人类从事高危环境和特殊工况;无人机则广泛应用在警用、城市管理、农业、地质、气象、电力、抢险救灾、视频拍摄等行业,实现大面积巡查,完成实时监测和评估。
典型企业。智能工业机器人领域,国际四大巨头仍占据较高市场份额,日本发那科和安川、德国库卡、瑞士ABB、意大利柯马侧重具有分拣和装配能力的智能工业机器人,英国Meta、德国Scansonic、日本安川聚焦激光视觉焊缝跟踪系统;国内智能工业机器人“三巨头”新松、云南昆船和北京机科占据国内90%市场份额,均有典型产品推出,新松重点提供自动化装配与检测生产线、物流与仓储自动化成套设备,云南昆船侧重烟草行业服务,北京机科主要应用于印钞造币、轮胎及军工领域。智能服务机器人领域,美国iRobot、中国科沃斯、美国IntuitiveSurgica、以色列Rewalk、荷兰Hot-Cheers分别聚焦于清洁、手术、康复及分拣等细分领域。智能特种机器人领域,波士顿动力围绕着拥有液压驱动核心技术的“大狗”机器人,不断构筑技术壁垒;大疆在国内消费级无人机领域占有率达75%,成为估值超百亿美元的“独角兽”企业;美国Howeand Howe Techonologies则专注生产消防机器人,应用于应急救援场景。
表12 智能机器人主要产品及典型企业
资料来源:中国电子学会整理
2、智能金融
金融行业与整个社会存在巨大的交织网络,每时每刻都能够产生金融交易、客户信息、市场分析、风险控制、投资顾问等多种海量数据。促进人工智能技术与金融行业相融合,在前端可以增强用户的便利性和安全性,在中台支持授信、各类金融交易和金融分析中的决策,在后台用于风险防控和监督。这将大幅改变金融行业现有格局,推动银行、保险、理财、借贷、投资等各类金融服务的个性化、定制化和智能化。受智能客服、金融搜索引擎及身份验证入口级产品的广泛普及和应用,智能金融全球产业规模在2020年会接近52亿美元,我国将达到8亿美元。
核心技术。当前,线上交易引发的隐私泄露及金融诈骗频出,同时随着移动终端和金融机构客户端的普及,提取的用户金融数据逐步丰富,金融机构线上服务能力和用户隐私和交易风控就变得至关重要,语音识别、自然语音处理、计算机视觉、生物特征识别和机器学习等技术得到了广泛应用。语音识别与自然语音处理技术可以为前端服务客户实现批量人性化和个性化的服务;计算机视觉与生物特征识别技术则为金融支付验证提供了保障;机器学习技术一方面通过导入海量金融交易数据,从中分析信用卡数据,识别欺诈交易,并提前预测交易变化趋势,另一方面通过构建金融知识图谱将不同来源的结构化和非结构化的数据整合到一起,建立基于大数据的完整征信授信体系。
主要产品。基于电话、网页在线、微信、短信及APP等多模式多频次的金融信息及服务获取渠道,相对较为成熟并已经逐步推广的产品包括智能客服、金融搜索引擎和身份验证,通过构建知识图谱实现理解答复及信息关联体系、提供远程开户和刷脸支付等便捷方式帮助金融机构节省人力成本。同时,随着用户消费及信贷能力的逐步提升,也涌现出一批征信和风险控制的产品,但受限于数据库的规模和数据源的相对难以获取,目前大部分集中在客观呈现款人、企业间、行业间的信息维度关联方面。此外,金融类或资产管理类公司为持续提供用户理财和升值的资产组合推出了智能投顾产品,可根据历史经验和新的市场信息来预测金融资产的价格波动趋势,以此创建符合风险收益的投资组合。
典型企业。智能客服、身份验证和金融搜索引擎领域创新企业较多,着重于引流扩量。智齿科技、网易七鱼及美国DigitalGenius均着重通过用户体验提升客户量,旷世科技、商汤科技及依图围绕着人脸识别的核心技术进入金融领域,融360、好贷网、资信客聚焦垂直领域打造金融服务的入口。征信及风控领域企业以大数据为壁垒,逐步出现行业龙头。启信宝和美国ZestFinance不断扩容数据基础,形成“平台黑洞”优势,启信宝通过提取100多家官方网站数据产品侧重呈现客观数据整合,ZestFinance则使用谷歌的大数据模型建立信用评分体系。智能投顾多为金融机构专业人才或者投资顾问公司转型而来,美国Wealthfront、弥财、财鲸等主要通过投资ETF组合以达到资产配置,理财魔方、钱景私人理财则专注基金产品的覆盖,雪球和金贝塔等以对量化策略、投资名人的股票组合的跟投为内容展开资讯传递和信息交流。
表13 智能金融主要产品及典型企业
资料来源:中国电子学会整理
3、智能医疗
促使智能机器和设备代替医生完成部分工作,更多地触达用户,只是智能医疗功用的部分体现。运用人工智能技术对医疗案例和经验数据进行深度学习和决策判断,显著提高医疗机构和人员的工作效率并大幅降低医疗成本,才是智能医疗的核心目标。同时,通过人工智能的引导和约束,促使患者自觉自查、加强预防,更早发现和更好管理潜在疾病,也是智能医疗在未来的重要发展方向。
核心技术。医疗水平的提升和医疗设备的完善使得患者就诊过程会产生与日俱增的就诊数据,爆炸式信息增长让医生无法无差错的完成诊断和治疗,同时随着人们健康意识的加强,预防性和精准性治疗同时受到关注。图像识别、语音语义识别、深度学习技术在医疗领域得到广泛应用。图像识别、语音语义识别技术可充分获取患者的饮食习惯、锻炼周期、服药习惯等个人生活习惯信息以对症下药,深度学习技术可通过计算机模拟预测药物活性、安全性和副作用,降低药物研发周期,并辅助医生工作实现更精准诊断和治疗。
主要产品。期待健康长寿的意愿随着人们生活质量的提高持续增强,适用于生活化的身体管理的智能健康管理产品率先成为热点,以数据形式引导个人生活习惯以达到基于精准医学的健康管理。同时,医生为能进行更精准并且效率更高的诊断和治疗,往往会围绕着医疗领域过往沉淀的大量病理案例,不断从预防的角度规避疾病或提前预测药物的可行性,智能影像、智能诊疗等智能医疗产品快速兴起,逐渐取代经验诊断,通过大量的影像数据和诊断数据模拟医疗专家的思维、诊断推理和治疗过程,从而给出更可靠的诊断和治疗方案。
典型企业。智能健康管理多面向消费端客户,创新企业大量涌现,大部分集中在美国。如Next IT、Sense.ly和AiCure均是从日常健康管理切入移动医疗,Welltok则通过可穿戴设进行健康干预。智能诊疗领域取得显著进展,IBM Watson以肿瘤为重心,在慢病管理、精准医疗、体外检测等九大医疗领域中实现突破,美国MedWhat、英国Babylon Health和中国拍医拍、康夫子正在聚焦智能诊疗的单个应用进入该领域。智能影像领域以创新企业为主,围绕影像数据源竞争激烈。美国Butterfly Network和中国推想科技着重打造影像设备,美国Enlitic则重点关注癌症监测,中国Deepcare围绕SaaS模式为行业提供“算法+有效数据”服务。
表14 智能医疗主要产品及典型企业
4、智能安防
随着高清视频、智能分析、云计算和大数据等相关技术的发展,传统的被动防御安防系统正在升级成为主动判断和预警的智能安防系统。安防行业也从单一的安全领域向多行业应用、提升生产效率、提高生活智能化程度方向发展,为更多的行业和人群提供可视化、智能化解决方案。随着智慧城市、智能建筑、智慧交通等智能化产业的带动,智能安防也将保持高速增长,预计在2020年全球产业规模实现106亿美元,我国会达到20亿美元。
核心技术。随着平安城市建设的不断推进,监控点位越来越多,从最初的几千路到几万路甚至于到现在几十万路的规模,依托视频和卡口产生的海量数据,智能安防已经延展到事后追查、事中防范响应、事前预防的全生命周期。目标检测、目标跟踪和目标属性提取等视频结构化技术,以及海量数据管理、大规模分布式计算和数据挖掘等大数据技术已经取代传统的人海战术,实时分析视频内容,探测异常信息,进行风险预测。视频结构化技术可以通过识别目标并持续跟踪生成图片结果,提取目标属性归纳可视化特征;大数据技术则用于采集、存储人工智能应用所涉及的全方位数据资源,并基于时间轴进行数据累积,开展特征匹配和模型仿真,辅助安防部门更快、更准地找到有效的资源,进行风险预测和评估。
主要产品。为避免社会不稳定事件频频发生的影响,各国对治安和安防的需求都在不断上升,这对更高效、更精准、覆盖面更广的安防服务提出新的需求,公安、交通、楼宇这些代表性的行业都已开始积极利用基于人工智能的硬件及定制化系统。智能公安管理系统汇总海量城市级信息,可对嫌疑人的信息进行实时分析,将犯罪嫌疑人的轨迹锁定由原来的几天缩短到几分钟,同时其强大的交互能力还能与办案民警进行自然语言方式的沟通,真正成为办案人员的专家助手。智能交通管理系统实时掌握城市道路上通行车辆的轨迹信息、停车场的车辆信息以及小区的停车信息,预测交通流量变化和停车位数量变化,合理调配资源、疏导交通,提升整个城市的运行效率。智能楼宇管理系统综合控制着建筑的安防、能耗,对于进出大厦的人、车、物实现实时的跟踪定位,监控大楼的能源消耗,使得大厦的运行效率最优。
典型企业。从提供的产品类型来看,智能安防领域的企业主要分为人工智能芯片、硬件和系统、软件算法三大类别。在芯片领域,跨国巨头企业占较高市场份额,如美国英伟达和英特尔。在硬件和系统领域,各国均以采购本国产品为主,国内主要采购对象为海康威视、大华集团,海康具有深厚的技术积累和成规模的研发团队,大华持续构建广泛的营销网络;美国则有ADT、DSC、OPTEX等高端品牌占据了安防市场大部分份额。在软件算法领域,美国谷歌、Facebook、微软开源代码并提供整体解决方案,中国旷视科技、商汤科技、云从科技等企业也在专注于技术创新研发。
表15 智能安防主要产品及典型企业
5、智能驾驶
智能驾驶通过车上搭载传感器,感知周围环境,通过算法的模型识别和计算,辅助汽车电子控制单元或直接辅助驾驶员做出决策,从而让汽车行驶更加智能化,提升汽车驾驶的安全性和舒适性。根据智能化水平的不同,同时参考SAE的评级标准,可将智能驾驶由低到高分为五个级别,依次是驾驶支援、部分自动化、有条件自动化、高度自动化、完全自动化。在未来各国智能驾驶相关政策法规逐渐成型、行业内技术不断完善、智能驾驶企业积极推动应用落地的情况下,智能驾驶产业规模将保持持续扩大趋势,预计在2020年全球产业规模实现95亿美元,我国会达到12亿美元。
核心技术。随着汽车产业的成熟和普及,各城市交通拥堵愈发严重,汽车尾气带来的环境污染也逐渐影响了人们的生活环境和空气质量,应用计算机视觉、深度学习和知识图谱技术的智能化环保型驾驶方式为解决经济问题和社会问题创造良机。计算机视觉技术对周围的交通环境,如本车在哪里、其它车在哪里、道路多宽、限速多少、现在是红灯还是绿灯等进行识别;深度学习技术和知识图谱构建理解、规划、决策以及经验,比如红灯要停车、路口要减速、何时及如何换道、当前加速还是减速等,同时按照时间顺序更好地统筹安排车辆使用提高车辆的使用效率,减少车辆消费总量,有效减少碳排放;机器学习操控汽车,如方向盘是否转到位、油门刹车档位如何协调等。
主要产品。智能驾驶核心依靠感知探测一定范围内障碍物,并依据已设置好的路线规划实施驾驶行为,各式车载雷达、传感器、辅助驾驶系统和高精地图可以实现驾驶、车和路的交互与融合。车载雷达可探测路肩、车辆、行人等的方位、距离及移动速度,视觉传感器用来识别车道线、停止线、交通信号灯、交通标志牌、行人及车辆等信息,定位传感器用来实时获取经纬度坐标、速度、加速度、航向角等高精度定位,车身传感器通过整车网络接口获取诸如车速、轮速、档位等车辆本身的信息,高级辅助驾驶系统(ADAS)实时收集车内外的环境数据以及时察觉潜在危险,高精度地图实现地图匹配、辅助环境感知、路径规划的作用。
典型企业。智能驾驶分为三层金字塔供应链格局,顶层包括整车及整体解决方案,中层是指高级辅助驾驶系统,底层是指零部件供应商。在整车及整体解决方案层级,科技型公司凭借在人工智能、人机交互方面的优势抢占市场份额。特斯拉通过成熟硬件和机器学习打造智能驾驶商用化车型,谷歌则重点完善智能驾驶方案并向整车制造能力延伸。在高级辅助驾驶系统层级,供应商基本由跨国巨头垄断。德国博世在传感器、自动驾驶、控制、软件等领域共计拥有约450项专利,美国德尔福则通过资本手段布局全产业链,以色列Mobileye在摄像头视觉系统领域占据国际领先地位。在底层零部件供应商层级,中国厂商比重日益增强,围绕某些部件实现技术突破,打造细分市场龙头,如四维图新的车载芯片、拓普集团的智能刹车系统IBS、索菱股份的车载智能系统CID、宁波高发的CAN 总线控制系统、兴民智通的智能用车系统驾宝盒子、盛路通信的夜间驾驶辅助系统、车道偏移提醒系统、盲区检测系统及万安科技的电子制动产品等。
表16 智能驾驶主要产品及典型企业
6、智能搜索
智能搜索是结合了人工智能技术的新一代搜索,除了能提供传统的快速检索、相关度排序等功能,还能提供用户角色登记、用户兴趣自动识别、内容的语义理解、智能信息化过滤和推送等功能,具有信息服务的智能化、人性化特征,允许采用自然语言进行信息的检索,为用户提供更方便、更确切的搜索服务。
核心技术。在信息爆炸时代,用户需要通过最短时间锁定最有价值信息。为匹配用户的请求,实现网络资源快速检索,搜索的方式和算法都有变化。应用到搜索方式的主要技术有语音识别、图像识别和文本识别,改善搜索算法的技术则包括启发式搜索算法、智能代理技术及自然语言查询。语音识别、图像识别和文本识别可全方位识别搜索信息输入属性,提升搜索的便捷性和准确度。启发式搜索算法、智能代理技术及自然语言查询可根据相关度及用户兴趣的评价函数选择最匹配信息链接,自动地将用户感兴趣的、对用户有用的信息提交给用户,并引入用户反馈来完善检索机制,实现自然语言的信息检索,为用户提供更方便、更确切的搜索服务。
主要产品。随着信息技术的迅速发展和互联网的广泛普及,网络上信息量成几何级数的增长,传统的搜索引擎技术在日益庞大的信息量面前逐渐显得力不从心,多样化的搜索方式和更精准的搜索算法产品应运而生。淘淘搜和百度搜图、听歌识曲、高德地图和百度地图、墨迹天气等产品,分别满足用户在图像搜索、语音搜索、定位搜索、天气搜索等场景的信息匹配和推送。出门问问、呱呱财经等产品则聚焦于垂直类智能搜索领域,实现用户对某具体领域单点信息需求的充分筛选。
典型企业。在提供智能搜索方式的企业中,阿里巴巴、百度从文本搜索延伸至图像搜索,英国Shazam、中国酷狗、网易、猎曲奇兵不断提升语音搜索的准确率,百度、高德均推出基于定位搜索的高精地图,墨迹风云科技公司专注天气搜索成为移动端用户量第一。在提供智能搜索算法的企业中,传统搜索引擎巨头升级为主,创新企业多聚焦垂直领域。科技巨头如美国谷歌、Wolfram Alpha、中国百度、雅虎、搜狐等专注技术驱动,创新企业如齐聚科技则侧重服务驱动。
表17 智能搜索主要产品及典型企业
7、智能教育
智能教育侧重启发与引导,关注学生个性化的教育和交互,学生能够获得实时反馈和自动化辅导,家长可以通过更为便捷和成本更低的方式看到孩子实时学习情况,老师能收获更丰富的教学资源、学生个性化学习数据来实现因材施教,学校也能提供高质量的教育,政府则将更容易为所有人提供可负担、更均衡的教育。自动化辅导优先通过搜题的应用取得爆发式增长,预计2020年全球智能教育产业规模可达108亿美元,我国将接近10亿美元。
核心技术。智能教育建立在与学生充分的交互和数据获取的基础上,并在海量的教育数据中,匹配用户的学习需求,最终能够完成辅助教育和评估反馈,语音语义识别、图像识别、知识图谱和深度学习技术应用较多。语音语义识别、图像识别实现了规模化的自动批改和个性化反馈;知识图谱和深度学习技术搜集学生学习数据并完成自动化辅导和答疑,预测学生未来表现,智能化推荐最适合学生的内容,最终高效、显著地提升学习效果。
主要产品。对教师人力资源的过度依赖是教育行业问题根本所在,能够辅助教育过程、提升教师效率,同时激发学生自主学习兴趣的产品,率先得到市场的认可,目前相对成熟的产品有自动化辅导、智能测评和个性化学习。自动化辅导可在两秒内反馈出答案和解题思路,手写的题目的识别正确率也已达到70%以上,大幅提升学生的学习效率。智能测评不仅可以对用户跟读进行语音测评和指导,同时还能通过手写文字识别、机器翻译、作文自动评阅技术实现规模化阅卷的作业测评。个性化学习基于学习行为的数据分析,推荐适合学生水平的学习内容。
典型企业。从事自动化辅导和个性化学习的企业均聚焦单一产品功能和教育区间,目前主要通过融资方式持续补贴用户提升获客能力。美国的Volley 和中国的猿题库、作业帮、学霸君和阿凡题聚焦K12教育的题库辅导和答疑,均推出拍照搜题完成题库答疑或老师答疑,中国郎播网、英语流利说和多邻国等侧重语言辅导,美国Newsela、LightSail等建立阅读数据库个性化提供阅读材料。智能测评企业主要集中在英语科目,如中国科大讯飞以智能语音技术为核心推出智能阅卷系统,批改网和美国LightSide通过数据库匹配完成文本测评。
表18 智能教育主要产品及典型企业
8、智能人居
智能人居以家庭住宅为平台,基于物联网技术和云计算平台构建由智能家居生态圈,涵盖智能冰箱、智能电视、智能空调等智能家电,智能音箱、智能手表等智能硬件,智能窗帘、智能衣柜、智能卫浴等智能家居,智能人居环境管理等诸多方面,可实现远程控制设备、设备间互联互通、设备自我学习等功能,并通过收集、分析用户行为数据,为用户提供个性化生活服务,使家居生活安全、舒适、节能、高效、便捷。
核心技术。随着移动互联网技术的大规模普及应用,为人们精细化掌控人居环境质量与模式提供了基础支撑,人工智能技术的持续发展,又进一步促使人居环境中的管理、辅助、通信、服务、信息获取等功能再次实现智能化的组合优化,以达到借助科技手段管理生活方式的目的。在此背景下,传感器技术、无线及近场通讯设备、物联网技术、深度学习、大数据及云计算技术得到较多应用。传感器和通讯设备对人居环境进行监测形成的数据流,会通过云计算和深度学习建立相应模型,再依托家用物联网对室内的电器设备乃至整个建筑的实时控制,将模型对应的参数和状态优化方案反馈到人居环境中,为人居生活的计划、管理、服务、支付等方面提供支持。
主要产品。随着技术的进步、人均收入的提升和对舒适生活环境的追求,人们需要的不仅是具备传统的居住功能的住宅,同时也需要兼备智能监测、环境控制、信息交互等全方位感知功能的智能居住环境。智能家居作为终端首先备受市场关注,具有通信功能的家用智能硬件及设备在大数据和云计算技术的支持下,能够完成远程控制、网络通信、防盗报警等较为复杂的任务。智能人居管理系统是以搭载大量移动互联网应用为基础,实现人居环境智能化改造,如生成家庭装潢设计与家具摆放设计,通过天气数据、已有服装数据、所处场合的风格自动生成穿衣指南,或者通过人工助手借助语音识别、语义分析等技术,满足人类在生活中的一些日常即时需求。
典型企业。具备智能人居解决方案提供能力的龙头企业众多,可大致分为传统家电厂商、智能硬件厂商、互联网电商及创新企业,各家布局方式互不相同。海尔、美的聚焦智能家居终端,小米侧重于面向众多开发者提供硬件开放式接口,华为致力于提供软硬件一体化楼宇级解决方案,京东通过轻资产、互联网化的运营模式号召合作伙伴加入其线上平台和供应链,国安瑞通过数据挖掘提供覆盖操作终端硬件、系统智能云平台、建筑智能设备的闭环解决方案提升室内人居感受。
表19 智能人居主要产品及典型企业
(五)国内外产业对比分析
1、基础层产业国外多点布局产品种类丰富,国内技术相对薄弱但初创企业表现活跃
国外企业凭借领先的技术优势展开全产业链布局。人工智能产业近年来不断突破新的极限,在深度和广度上都得到良好发展,很大程度上受益于智能传感器、智能芯片和算法模型等基础层产业的爆发式增长。国外科技企业及机构依赖强大的资源整合能力与持续创新功能,不断加快基础层底层技术研发与应用产品实践步伐,围绕智能硬件与软件核心算法产业链上下游进行有效部署,打造面向市场实际应用需求的产品体系与创新机制,催生了以新型时差测距传感器、类脑芯片、大规模卷积神经网络深度学习算法等为代表的前沿技术产品,有效促进基础层产业对技术层和应用层产业的支撑推动作用。
国内初创企业有望实现创新突破。目前,基础层产业的核心技术大部分仍掌握在国外企业手中,为我国企业自主开展研发带来了不利的壁垒封锁,限制了产业整体发展。但是,国内企业及科研机构进一步加强了对传感器、底层芯片及算法等基础层技术的研发力度,持续加大研究投入,以寒武纪、深鉴科技、云知声为代表的一批国内初创企业在智能芯片和算法模型方面已推动展开相关研发工作,取得了一定的技术积累,形成了较为完整的技术和产品体系,有望在未来引领产业创新发展。
2、技术层产业国外业已打通应用端,国内围绕特定领域实施产品精准投放
国外企业聚焦语音识别和图像识别领域推出成熟商业应用。在多元化的应用环境驱动影响下,语音识别和图像识别正从科研、国防、医疗等专用领域逐渐走入智能化、娱乐化的工作与生活场景,受到国外企业的广泛关注。谷歌、微软、亚马逊等国外技术公司重点围绕个人语音助手和人脸识别等展开技术研究与产品开发,打造出较为成熟的商业模式,诞生了一批符合实际应用场景需求,具备独特竞争优势的商业化产品,满足了用户在信息安全、多媒体交互和社交娱乐等方面的实际诉求。
国内企业瞄准安防、家居及教育等领域展开特定产品开发。由现实国情和具体市场需求所决定,国内企业的技术层产品研发侧重于安防监控、智能家居及教育培训等特定领域,形成了一批内容丰富、功能完善的优秀产品。旷视科技、海康威视等企业重点研发人脸检测识别、指纹识别等技术产品,用于综合案件和重要场所管控等领域。华为、云知声、国安瑞等企业成功将语音识别、人脸识别等技术应用于智能家居领域,打造舒适便捷的人居环境。科大讯飞、汉王等企业则围绕语音交互、语义理解、文本识别等关键技术打造在线阅卷、在线辅导以及口语评测等产品,广泛服务于远程教育和技能培训。
3、应用层产业国外较多依赖技术内生发展驱动,国内较为注重商业模式创新
国外企业注重技术进步对应用领域创新的推动放大作用。人工智能应用层领域众多,各领域交叉性较强,内在联系紧密,呈现相互促进融合发展态势。以深度学习为例,主流的通用开源深度学习框架,可以作为人工智能底层技术平台,在包括智能机器人、智能医疗、智能驾驶、智能教育等应用层各方面得到广泛应用,一旦深度学习技术有所创新,其产生的积极影响将惠及多个应用层领域,而这些应用层领域之间的相互促进作用又会继续放大技术进步成果,带来创新倍增效应。基于此,国外企业在持续拓展人工智能应用范围的同时,始终坚持底层技术研发为主导的优先发展战略,聚焦技术的内生增长潜力,不断寻找挖掘新的应用需求。
国内企业立足市场特色加快商业模式创新步伐。国内人工智能应用层企业立足个人消费与生活服务领域,关注垂直行业应用需求,有效细分目标市场,积极整合闲置资源,注重挖掘数据价值,通过商业模式的不断创新对应用层各领域进行持续渗透,着眼于增加产品的实用功能和改善用户体验。同时,大部分从事人工智能的国内企业也是由互联网业务起家,借鉴以往移动互联网和O2O(Online and Offline,线上线下)模式的成功商业经验,注重社区平台对用户和商家的分类功能及点对点服务特性,关注数据价值,构建人工智能应用精准营销和优质体验的业务生态体系。
第四章 投融资特征及趋势
(一)全球人工智能领域融资总额持续增长但增速放缓
全球智能化浪潮的兴起,引发人工智能成为创业热点,各类风险投资纷纷占位人工智能各应用领域,跨国科技巨头则围绕自身人工智能战略,通过投资和并购方式布局产业生态,由此带来了人工智能领域融资热度持续增高。截止2017年末,全球人工智能公司已突破2075家,跨越25个子门类,融资金额高达65亿美元。但是,创业企业随着融资到位,助力产品、数据和商业模式的不断完善,已逐步成为细分领域的龙头企业或者独角兽企业,单项目融资金额规模正在逐步增大,同时随着市场集中度的增高,人工智能领域创业成功的几率有所下降,使得融资增速逐渐放缓。预计到2020年,全球人工智能融资金额增速会由2017年的33%下降至20%。
图10全球人工智能企业投融资金额总量(2015-2020年)
(二)国内人工智能投资规模有望出现V型反转且大额项目频发
在移动互联网、O2O等技术和商业模式的推动下,风险投资市场在2015年整体偏好高估值,当年国内人工智能投资总规模高达8.9亿美元。但随着风险投资市场的逐渐成熟,在经过近三年的爆发式投资及对高估值项目的推崇之后,国内风险投资生态系统正在走下融资高峰,逐步回归到正常、健康的投资环境。在经历了2016年的短暂低谷后,2017年国内人工智能投资金额再创新高,达到10.3亿美元。随着投资市场的沉淀,人工智能技术不断突破,商业模式持续创新,逐渐培育出了产品和应用具有相当规模的优质企业和项目。同时,创业企业随着规模增长,持续发展所需金额较大,在后续融资阶段吸收了大部分的风险基金,近期大额投资案例频发,投资热点主要集中在人工智能领域的技术层和应用层,如自然语言处理类的今日头条、智能搜索类的出门问问等,融资额均超过1.5亿美元。
图11 我国人工智能企业投融资金额总量(2015-2020年)
(三)深度学习、图像视频识别和文本识别是资本市场当前力捧的热点
深度学习、图像视频识别和文本识别应用范围较广,市场潜力巨大,率先成为资本竞相追逐的对象。深度学习算法成为推动人工智能发展的焦点,相继在图片识别、机器翻译、语音识别、决策助手、生物特征识别等领域实现了创新突破,截止2017年,全球深度学习领域在技术层和应用层的融资总额高达33亿美元。图像视频识别广泛应用于智能工业机器人、智能医疗、智能安防、智能驾驶等领域,全球共计融资总额高达16.6亿美元。文本识别则应用于智能投顾、智能客服、智能搜索、智能教育等领域,全球融资总额超过9.3亿美元。
表20 全球各领域人工智能企业融资额前五名
数据统计时间2010.1.1至2017.12.30
资料来源:中国电子学会整理
(四)全球科技巨头通过投资并购围绕人工智能构筑差异化竞争力
人工智能被全球巨头企业视为下一次技术革命的突破点,研发和投资并购同步发力并且侧重点各异。谷歌在研发方面依托人工智能改善搜索功能并开源机器学习系统,在投资方面通过收购Wavii、Moodstocks、SayNow等完成文本识别、图像视频识别、语音识别的技术布局,收购深度学习技术公司DeepMind完善开源平台能力,收购Kaggle扩大在开发者层面和人工智能开源平台方面的优势。苹果则集中在虚拟助手和深度学习平台的创业型小公司,购入Vocal IQ让Siri在虚拟助手领域取得领先,同时也收购了面向开发者和数据科学家的深度学习平台Turi。IBM重点围绕Watson平台的功能完善开展投资并购,收购Blekko丰富和深化Watson认知计算的能力,收购AlchemyAPI加强Watson人工智能与计算服务能力,收购Cognea增强Watson系统对话的能力。微软投资了Agolo和Bonsai公司,分别致力于布局开发先进摘要软件企业和部署智能系统。亚马逊通过收购语音识别公司Yap和语音助理公司Evi,构建了语音操作系统Alexa的雏形,并不断完善Alexa的应用能力,逐步整合智能家居语音控制系统。
表21 全球科技巨头主要收购企业
资料来源:中国电子学会整理
第五章 新一代人工智能中长期技术及产业发展趋势
(一)技术趋势
1、既有架构面临挑战,新型人工智能芯片呼之欲出
人工智能芯片由非定制化向定制化方向发展。人工智能推动新一轮计算革命,深度学习需要海量数据并行运算,传统计算架构已无法支撑深度学习的大规模并行计算需求。目前使用的GPU、FPGA(可编程门阵列芯片)均非人工智能定制芯片,存在着一定的局限性,深度学习需要更适应此类算法的新的底层硬件来加速计算过程。目前,谷歌公司已经开发出新型TPU(张量处理器),可以在芯片中节省出更多的操作时间,适用于更复杂和强大的机器学习模型,并且能够进行快速部署;英特尔以167亿美元收购了FPGA厂商Altera后,也在研究CPU+FPGA的异构方案,以达到更好适应人工智能时代的定制化计算的目的。
量子计算引领下一代人工智能芯片发展潮流。对于目前的经典计算机,处理器的计算性能已渐渐远离摩尔定律,在IBM推出5 nm制程工艺之后,CPU中晶体管的数量已很难再实现每两年翻一番的预期。在更小尺寸的工艺条件下,晶体管性能受限于电子特性将变得不再可靠。量子计算将为人工智能带来革命性的发展机遇,量子比特数量会以指数增长的形式快速上升,小型化的量子芯片可以使人工智能前端系统的快速实时处理成为可能。未来,车载智能系统、无人机智能系统等领域或将首先应用量子计算芯片系统。
2、经济社会发展存在迫切需求,专用智能向通用智能升级
人类生产生活方式变革对人工智能提出了新的发展需要。随着科技不断发展和社会结构深入变革,人类面临着生活、生产、资源、环境等方面一系列需要回答的重大问题,现有的认知水平和治理能力面临着前所未有的挑战。在博弈、识别、控制、预测等专业领域以及城市发展、生态保护、经济管理、金融风险等宏观系统方面,迫切需要一种范围广、集成度高、适应力强的通用智慧,提供从辅助性决策工具到专业性解决方案的升级,显著提升人类阅读、管理、重组知识的能力。
通用人工智能具备连接人工智能和人类特征的优势。通用人工智能(Artificial General Intelligence,AGI)具备执行一般智慧行为的能力,可以将人工智能和意识、感性、知识和自觉等人类的特征互相连结,具备减少对领域知识的依赖性、提高处理任务的适用性以及实现机器自主认知的纠偏性等特点。通用智能将具备处理多种类型任务和适应未曾预料情形的能力,其实质进展将真正开启智能化革命的序幕,与现有物理及信息世界高度融合,深刻影响社会经济发展的各个方面。
3、技术平台开源化已成趋势,围绕超级智能生态系统的竞争即将展开
全球主流技术厂商纷纷围绕深度学习开放技术平台。2015年12月,人工智能初创公司Open AI开源其研究成果OpenAI Gym,拉开了全球科技巨头开放各自的深度学习技术平台的序幕,如谷歌和Facebook分别将深度学习平台TensorFlow和Torchnet全面开源,微软开源CNTK,DeepMind 宣布开源深度学习训练平台Labyrinth并改名为DeepMind Lab;国内百度公布了旗下的深度学习平台PaddlePaddle,腾讯公布一站式深度学习平台DI-X等。深度学习技术平台的开源化,一方面能够使平台吸引潜在用户,提高应用潜力,在深度学习领域进行持续创新;另一方面,各科技公司未来将围绕开源平台建立人工智能超级生态系统,进一步整合技术与应用,有效布局人工智能全产业链。
构建超级生态系统成为未来人工智能技术发展与竞争的主流。下一阶段,借助人工智能超级生态系统,科技公司可以将人工智能领域复杂的推理能力应用到之前缺乏机器学习经验的其它领域,更加方便地指导用户使用机器学习训练其商用模型,评估与优化系统潜力,同时利用收集到的数据对用户的下一步行为做出更好的规划与建议,促进应用水平提高。围绕各自的生态系统,科技巨头们将在人工智能技术与产业的战场展开激烈竞争,角逐行业优势,争夺产业主导话语权。
(二)产业趋势
1、人工智能产业仍将保持爆发式增长
全球正在经历科技和产业高度耦合、深度迭加的新一轮变革,创新已由单一领域的离散式突破向跨领域的群体性突破转变,由单一的产品创新向集大成的系统创新转变,信息、生命、材料、制造、能源等领域竞相出现重大突破。其中,人工智能的表现一枝独秀,已历史性地站在了变革的风口,作为下一阶段科技变革浪潮的新引擎,将渗透至各行各业,助力传统行业实现跨越式升级,带来广阔的发展前景与良好的市场机遇。以微软、谷歌、Facebook以及百度、阿里、腾讯等为代表的国内外科技巨头纷纷积极卡位,布局人工智能全产业链,各路资本也竞相角逐人工智能产业潜在增长点,充分展示了对于未来市场的乐观预判。得益于人工智能技术的不断升级以及商业模式的推陈出新,全球人工智能产业需求将进一步放量,2020年全球人工智能产业规模将超过1100亿美元,年均增速达到47.8%,我国人工智能产业规模也将达到180亿美元,年均增速达到56.5%。在产业规模整体爆发式增长的背景下,基础层、技术层和应用层的各细分领域也将保持同步增长态势,尤其以应用层各产业领域的增长表现最为抢眼。
2、我国将成为全球人工智能产业发展的重要推动者
人工智能已受到世界各主要科技强国的广泛关注,成为以新一轮科技革命为基础的国家竞争制高点。欧盟的“人脑计划”、日本的“人工智能/大数据/物联网/网络安全综合项目”以及美国的《国家人工智能研究与发展战略规划》,都将人工智能全面提升到国家战略层面。目前,美国仍然是全球人工智能产业发展的主导者,凭借着数量众多、实力雄厚的科技企业和资源丰富、人才济济的高校与科研机构,美国从人工智能的底层技术到应用市场都拥有无可比拟的巨大优势。我国目前已经是人工智能大国,影响力稳步提升,从2016年起将人工智能领域建设已上升至国家战略层面,相关政策进入全面爆发期。得益于人工智能产业对经济的积极影响和良好的应用市场背景,未来几年内有望持续获得国家大力支持,众多企业、高校及科研机构也将不断加大技术及应用研发投入力度,共同推动我国保持并发展自身竞争优势,深度参与全球人工智能产业合作竞争。
3、智能芯片、智能机器人及智能驾驶等热点应用将持续受到关注
人工智能目前已经跨越了单纯依靠数据获取来实现技术提升与推动应用发展的阶段,传统的API(Application Programming Interface,应用程序编程接口)开放和积木式创新已经无法满足人工智能的技术发展,数据与应用的迭代式螺旋上升发展将推动人工智能应用层产业的跨越式发展。在下一阶段,预期智能芯片、智能机器人及智能驾驶等产业将率先落地,凭借技术的早期积累与资本的持续注入占据相当的市场份额。智能芯片领域将由现有的CPU+GPU与CPU+FPGA异构模式,向新型人工智能专用芯片及量子芯片过渡,颠覆现有芯片产业格局;智能机器人将会应用到越来越多的特定场景之中,实力雄厚的机器人公司或将首先开发出适用于多个商业领域的通用型机器人,轻松适应不同环境;智能驾驶领域也将成为未来科技公司竞争的主战场,绝大部分车辆将达到2至3级驾驶能力(部分自动化和有条件自动化驾驶),而4至5级的驾驶(高度自动化和完全自动化驾驶)将会创造更大的产业发展机遇。
4、“平台+场景应用”主导的新型商业模式即将出现
现有的人工智能技术主要聚焦于为服务商提供解决方案,直接面对消费者端的产品相对较少。未来,随着人工智能产业的深入发展以及市场化机制的不断成熟,平台化趋势会更加突出,将出现若干主导平台加广泛场景应用的竞争格局,催生出更多新型的商业模式。通过海量优质的多维数据结合大规模计算力的投入,以应用场景为接口,人工智能产业将构建起覆盖全产业链生态的商业模式,满足用户复杂多变的实际需求。同时,具备新型芯片、移动智能设备、大型服务器、无人车、机器人等设备研发制造能力的企业也能够结合应用环境,提供高效、低成本的运算能力和服务,与相关行业进行深度整合,从基础设施提供逐渐向产业链下游服务延伸拓展。
5、科技巨头企业的优势地位将受到初创公司的挑战
目前全球人工智能产业的发展实际上是由少数科技巨头公司主导,包括国内的BAT(百度、阿里、腾讯),以及国外的FAMGA(指Facebook、亚马逊、微软、谷歌和苹果,截至2017年7月全球市值最高的五个公司)。凭借着强大的技术和资本垄断能力,科技巨头公司在目前代表着全球人工智能产业发展的最前沿,强势保持人工智能科技创新与产业发展的优势地位。但除科技巨头之外,全世界还有千余家人工智能初创企业,半数以上已经获得投资机构青睐,数量以美国和中国居多。短期来看,科技巨头们虽然在人工智能各领域都已投下棋子,但大多是为企业自身以及企业相关业务进行服务,业务面广却并非无懈可击,初创公司往往聚焦于行业某细分领域并深入探索,与科技巨头在某些领域相比存在一定的比较优势。同时,广阔的市场容量对产业化应用提出了更加层次化的需求,初创企业可以结合自身特点进行选择化竞争,避开与科技巨头的直接较量。
6、行业监管问题迫切需要引起各方重视
任何新兴科技产业从诞生到具体落地,都需要面临技术、商业、法律和政策层面的诸多挑战。在当前人工智能产业正处于蓬勃发展阶段的同时,必须认真考虑到未来行业监管措施的制定与实施。人工智能开发者在收集和使用数据的过程中,需要采取适当的技术手段保护个人隐私安全,防止个人信息的泄露、篡改及损毁;在训练和设计过程中需要具备广泛的包容性,应该充分考虑弱势群体的利益,并对道德与法律的极端情况设置特别的判断规则;在技术或者产品的研发流程中,必须设置行政许可和准入限制,研判如何发放人工智能产品在各细分领域的应用牌照。人工智能行业的监管问题不是单独哪一个群体面临的问题,具有广泛的社会性、系统性与复杂性,需要企业、政府、用户、科技社团等第三方组织共同参与、群策群力,构建促进人工智能产业良好发展的创新应用生态环境。
第六章 推动新一代人工智能发展的措施建议
(一)引导树立正确发展理念
一是依托国家新一代人工智能发展规划制定详细指导意见和行动指南。围绕人工智能技术和产业发展在动能、路径、举措方面的现实要求,按照供给侧结构性改革的总体部署,以催生经济增长新动能,形成结构调整新模式,培育产业升级新业态,塑造国际竞争新优势为导向,以人工智能催生的各类新兴产品、组织业态、产业结构、商业模式为核心,将着力推进人工智能技术及产业发展作为具备一定条件和基础区域的经济社会发展战略规划体系的重要组成,形成科学、可行、持续的工作方案。
二是将与人工智能融合发展作为传统产业变革创新的重要方向。要引导传统产业充分认识到“信息”与“智能”已经成为新的生产要素,与劳动、资本、土地等其他财富创造要素具有同等重要的地位,国民经济社会已经从工业经济时代进入信息经济时代,并且必将步入智能经济时代。围绕着新兴生产要素即将出现从生产工具到基础设施,从产业形态到商业模式的一系列重大变革。要充分借鉴、吸收、消化国外先进企业的既有成功经验,提炼、归纳、总结出符合国内企业基本情况、发展基础和行业特性的人工智能融合创新重点和发展路径,将人工智能作为创造产业新形态、重塑产业新竞争力的重要支撑和关键抓手。
(二)构建政府新型治理体系
一是推动监管、财税、立法领域的体制机制创新。人工智能与传统产业融合将催生大量新业态、新模式,要推动监管方式适时革新,从有章可循式的细则性管理转向“法无禁止即可为”式的调控性管理,为创新行为预留尽可能充足的发展空间,在财税和立法领域予以一定宽松环境,鼓励新生事物诞生和成长。同时,要积极探索政府、企业、行业协会及中介组织共同参与的多元化协同治理机制。
二是推动相关行政机构的治理组织架构优化调整。根据人工智能产业发展以及与传统产业融合所产生的新现象、新局面,积极应对在研发、生产、销售、服务、管理等领域面临的新问题,以构建与人工智能发展需求相契合的适应性制度为导向,以提升治理效率和有利于调整优化治理措施为着力点,突出治理组织架构变革的动态性和适应性,杜绝多头治理,避免推诿塞则,打破各种“玻璃门”和“弹簧门”。
(三)持续加强核心创新能力
一是集中力量突破重点领域核心关键技术。以人工智能技术安全可控发展为导向,组织实施人工智能重大技术攻关工程,研究制定云计算、大数据底层技术与机器学习、模式识别、人机交互通用技术的安全可控发展路线图。重点突破算法模型与智能芯片的技术瓶颈,围绕大数据智能、互联网群体智能、跨媒体智能、人机混合智能、自主智能系统等开展前瞻性、基础性研究,制定长期发展战略及分阶段目标,积极探索变革性创新,力争从“跟随式”发展跃升为“引领式”发展。
二是加快推进“双创”平台建设。将具备人工智能发展意愿和基础,规模大、实力强、管理好、素质高的龙头企业作为“双创”的重要主体,充分发挥大企业技术、管理、人才、渠道、资金、市场优势,通过设立产业投资基金、开展供应链金融服务、搭建创业孵化平台和协同创新平台等模式,加速技术成果转化,助推一批人工智能领域的中小企业快速成长。依托行业协会及中介机构设立开放式“双创”平台,促进企业间的资源协同与供需对接。鼓励传统企业和人工智能企业联合搭建基于在线网络的“双创”平台,推动企业发展理念、战略、组织、流程、管理和商业模式创新。
(四)着力夯实关键发展基础
一是抓紧抢占数据开放的战略高地。大力提倡数据思维,加强全社会数据编码应用,有组织有计划地挖掘生产、生活、医疗等领域的数据资源潜在应用价值,并推动数据安全法治化,保护国家数据安全,保护公民数据权益,做好构建全球数字资源平台的前瞻谋划。在充分保护公共安全和个人隐私的前提下,对一些基础性的可公开数据进行开放共享,建成共有数据池,使得更多的人工智能领域中小型创新创业企业能够享受到这些基础资源,促进算法模型和解决方案的优化升级,发掘更多的潜在增长点。
二是探索新型复合型人才的教育培训机制。加大人工智能人才培养力度,选择若干高水平大学,设立人工智能研究与培训中心,加大博士硕士培训规模,加深与机械、设计、医疗、电信、经济、城市规划等相关应用领域合作,加强与计算机科学、神经科学、认知科学、心理学等相关知识体系融合互动。鼓励具备能力的高校及科研机构搭建综合性平台,为相关研究人员提供交叉学科培训和应用交流对接。
(五)完善资本市场支撑环境
一是进一步建设相对宽松的融资环境。鼓励商业银行加大对有能力提供行业解决方案的人工智能企业融资的支持力度,适当降低抵押品等方面的要求。细化对知识产权质押贷款的价值评估标准和操作细则,适当减少创新创业型人工智能领域中小企业在申请知识产权质押贷款时的附加条件。规范发展债券市场,适度降低企业发债门槛。积极稳妥推进股票发行注册制改革,加快多层次股权市场建设,降低创业板准入门槛,力争加快建立战略新兴产业板,完善人工智能与传统产业融合催生的新技术、新业态、新模式主导下的创新型企业融资体系。
二是研究设立人工智能与传统产业融合创新发展专项基金。发挥政府资金的杠杆和乘数效应,引导整合社会资金,探索建立支持人工智能与传统产业融合创新的专项发展基金。在运作模式上采取政府引导、市场运作的模式,尊重市场规律,借鉴国际国内成功的产业发展基金管理运作经验,紧密结合国家重大战略决策,着力于培育发展人工智能与传统产业融合创新催生的大量新技术、新业态、新模式。一方面与地方相关园区基地紧密合作,参股区域性投资基金,逐步形成全国布局;另一方面参股社会资本,引导其科学合理有序地发展人工智能与传统产业融合创新的各项新业务。
(六)充分发挥行业组织作用
一是组织开展前瞻规划研究。围绕新一代人工智能发展特色及内涵外延框架,针对人工智能与传统产业融合创新带来的经济新变革,组织相关领域的协会、联盟和研究机构及时开展前瞻性研究,结合新一代人工智能发展趋势,对正在和将要出现的一大批新技术、新产品、新业态、新模式进行研判,提前规划发展路线图和战略重点,并对财税和立法领域面临的新问题进行专题研讨,提出政府治理模式变革的参考依据,发挥行业指导作用,提供智力支持。
二是打造促进人工智能技术及产业发展的创新服务体系。由行业主管部门牵头,以相关行业协会及联盟为依托,成立国家级的人工智能技术及产业发展促进中心,聘请院士级专家为中心顾问,围绕人工智能发展及与传统产业融合的现状及问题,建立和完善网络化、专业化、社会化的创新服务体系,开展成果转化、产融对接、检验检测、人才培训、专利申报、知识产权保护等服务,打造实体业务与网络平台的融合运行机制,探索以企业为主体的市场化运作模式。
(七)实现全球统筹协调发展
一是持续研究制定具备国际视野的标准规范体系。围绕人工智能当前阶段在具体行业的融合创新和应用推广需求,率先开展关键技术和领域的标准规范研究制定工作,积极参与国际相关标准制定,考虑在中文语音识别等特色优势领域重点推动团体标准的制定、完善和实施。推动提出符合中长期发展趋势的人工智能标准总体布局与框架,建立面向国际的,具有科学性、系统性、前瞻性的人工智能标准规范体系。
二是有效加强多元化国际合作。引导和支持国内人工智能企业与国际人工智能领先企业、知名高校、科研机构的紧密合作,及时追踪研究人工智能领域的国际前沿动态,鼓励国内人工智能企业与国外相关企业和机构在国内联合成立技术研发及产业化中心。积极依托“一带一路”,推动布局人工智能的国际研究基地、研发中心和人员培训。
七、推动新一代人工智能发展的措施建议
(一)引导树立正确发展理念
一是依托国家新一代人工智能发展规划制定详细指导意见和行动指南。围绕人工智能技术和产业发展在动能、路径、举措方面的现实要求,按照供给侧结构性改革的总体部署,以催生经济增长新动能,形成结构调整新模式,培育产业升级新业态,塑造国际竞争新优势为导向,以人工智能催生的各类新兴产品、组织业态、产业结构、商业模式为核心,将着力推进人工智能技术及产业发展作为具备一定条件和基础区域的经济社会发展战略规划体系的重要组成,形成科学、可行、持续的工作方案。
二是将与人工智能融合发展作为传统产业变革创新的重要方向。要引导传统产业充分认识到“信息”与“智能”已经成为新的生产要素,与劳动、资本、土地等其他财富创造要素具有同等重要的地位,国民经济社会已经从工业经济时代进入信息经济时代,并且必将步入智能经济时代。围绕着新兴生产要素即将出现从生产工具到基础设施,从产业形态到商业模式的一系列重大变革。要充分借鉴、吸收、消化国外先进企业的既有成功经验,提炼、归纳、总结出符合国内企业基本情况、发展基础和行业特性的人工智能融合创新重点和发展路径,将人工智能作为创造产业新形态、重塑产业新竞争力的重要支撑和关键抓手。
(二)构建政府新型治理体系
一是推动监管、财税、立法领域的体制机制创新。人工智能与传统产业融合将催生大量新业态、新模式,要推动监管方式适时革新,从有章可循式的细则性管理转向“法无禁止即可为”式的调控性管理,为创新行为预留尽可能充足的发展空间,在财税和立法领域予以一定宽松环境,鼓励新生事物诞生和成长。同时,要积极探索政府、企业、行业协会及中介组织共同参与的多元化协同治理机制。
二是推动相关行政机构的治理组织架构优化调整。根据人工智能产业发展以及与传统产业融合所产生的新现象、新局面,积极应对在研发、生产、销售、服务、管理等领域面临的新问题,以构建与人工智能发展需求相契合的适应性制度为导向,以提升治理效率和有利于调整优化治理措施为着力点,突出治理组织架构变革的动态性和适应性,杜绝多头治理,避免推诿塞则,打破各种“玻璃门”和“弹簧门”。
(三)持续加强核心创新能力
一是集中力量突破重点领域核心关键技术。以人工智能技术安全可控发展为导向,组织实施人工智能重大技术攻关工程,研究制定云计算、大数据底层技术与机器学习、模式识别、人机交互通用技术的安全可控发展路线图。重点突破算法模型与智能芯片的技术瓶颈,围绕大数据智能、互联网群体智能、跨媒体智能、人机混合智能、自主智能系统等开展前瞻性、基础性研究,制定长期发展战略及分阶段目标,积极探索变革性创新,力争从“跟随式”发展跃升为“引领式”发展。
二是加快推进“双创”平台建设。将具备人工智能发展意愿和基础,规模大、实力强、管理好、素质高的龙头企业作为“双创”的重要主体,充分发挥大企业技术、管理、人才、渠道、资金、市场优势,通过设立产业投资基金、开展供应链金融服务、搭建创业孵化平台和协同创新平台等模式,加速技术成果转化,助推一批人工智能领域的中小企业快速成长。依托行业协会及中介机构设立开放式“双创”平台,促进企业间的资源协同与供需对接。鼓励传统企业和人工智能企业联合搭建基于在线网络的“双创”平台,推动企业发展理念、战略、组织、流程、管理和商业模式创新。
(四)着力夯实关键发展基础
一是抓紧抢占数据开放的战略高地。大力提倡数据思维,加强全社会数据编码应用,有组织有计划地挖掘生产、生活、医疗等领域的数据资源潜在应用价值,并推动数据安全法治化,保护国家数据安全,保护公民数据权益,做好构建全球数字资源平台的前瞻谋划。在充分保护公共安全和个人隐私的前提下,对一些基础性的可公开数据进行开放共享,建成共有数据池,使得更多的人工智能领域中小型创新创业企业能够享受到这些基础资源,促进算法模型和解决方案的优化升级,发掘更多的潜在增长点。
二是探索新型复合型人才的教育培训机制。加大人工智能人才培养力度,选择若干高水平大学,设立人工智能研究与培训中心,加大博士硕士培训规模,加深与机械、设计、医疗、电信、经济、城市规划等相关应用领域合作,加强与计算机科学、神经科学、认知科学、心理学等相关知识体系融合互动。鼓励具备能力的高校及科研机构搭建综合性平台,为相关研究人员提供交叉学科培训和应用交流对接。
(五)完善资本市场支撑环境
一是进一步建设相对宽松的融资环境。鼓励商业银行加大对有能力提供行业解决方案的人工智能企业融资的支持力度,适当降低抵押品等方面的要求。细化对知识产权质押贷款的价值评估标准和操作细则,适当减少创新创业型人工智能领域中小企业在申请知识产权质押贷款时的附加条件。规范发展债券市场,适度降低企业发债门槛。积极稳妥推进股票发行注册制改革,加快多层次股权市场建设,降低创业板准入门槛,力争加快建立战略新兴产业板,完善人工智能与传统产业融合催生的新技术、新业态、新模式主导下的创新型企业融资体系。
二是研究设立人工智能与传统产业融合创新发展专项基金。发挥政府资金的杠杆和乘数效应,引导整合社会资金,探索建立支持人工智能与传统产业融合创新的专项发展基金。在运作模式上采取政府引导、市场运作的模式,尊重市场规律,借鉴国际国内成功的产业发展基金管理运作经验,紧密结合国家重大战略决策,着力于培育发展人工智能与传统产业融合创新催生的大量新技术、新业态、新模式。一方面与地方相关园区基地紧密合作,参股区域性投资基金,逐步形成全国布局;另一方面参股社会资本,引导其科学合理有序地发展人工智能与传统产业融合创新的各项新业务。
(六)充分发挥行业组织作用
一是组织开展前瞻规划研究。围绕新一代人工智能发展特色及内涵外延框架,针对人工智能与传统产业融合创新带来的经济新变革,组织相关领域的协会、联盟和研究机构及时开展前瞻性研究,结合新一代人工智能发展趋势,对正在和将要出现的一大批新技术、新产品、新业态、新模式进行研判,提前规划发展路线图和战略重点,并对财税和立法领域面临的新问题进行专题研讨,提出政府治理模式变革的参考依据,发挥行业指导作用,提供智力支持。
二是打造促进人工智能技术及产业发展的创新服务体系。由行业主管部门牵头,以相关行业协会及联盟为依托,成立国家级的人工智能技术及产业发展促进中心,聘请院士级专家为中心顾问,围绕人工智能发展及与传统产业融合的现状及问题,建立和完善网络化、专业化、社会化的创新服务体系,开展成果转化、产融对接、检验检测、人才培训、专利申报、知识产权保护等服务,打造实体业务与网络平台的融合运行机制,探索以企业为主体的市场化运作模式。
(七)实现全球统筹协调发展
一是持续研究制定具备国际视野的标准规范体系。围绕人工智能当前阶段在具体行业的融合创新和应用推广需求,率先开展关键技术和领域的标准规范研究制定工作,积极参与国际相关标准制定,考虑在中文语音识别等特色优势领域重点推动团体标准的制定、完善和实施。推动提出符合中长期发展趋势的人工智能标准总体布局与框架,建立面向国际的,具有科学性、系统性、前瞻性的人工智能标准规范体系。
二是有效加强多元化国际合作。引导和支持国内人工智能企业与国际人工智能领先企业、知名高校、科研机构的紧密合作,及时追踪研究人工智能领域的国际前沿动态,鼓励国内人工智能企业与国外相关企业和机构在国内联合成立技术研发及产业化中心。积极依托“一带一路”,推动布局人工智能的国际研究基地、研发中心和人员培训。
推荐《人工智能系列课》
或点击“”,查看详情