人工智能关键技术专利态势分析
1 引言
人工智能技术研究已有60年历史,当前全球人工智能相关专利申请量超过48.1万项INPADOC同族。人工智能相关专利最早出现在20世纪五六十年代,涉及驾驶控制、字符识别技术,美国、欧洲、日本和韩国等在人工智能技术领域研究起步比较早,早期进行了大量专利申请,2000年国外人工智能专利年度申请量已超过1.2万项。
我国人工智能技术研究起步较晚,早期专利申请量较低,从2000年左右开始逐渐缓慢增长,随着人工智能技术第三次浪潮,国内人工智能专利申请量明显增加,近五六年呈现爆发增长态势。
2 计算机视觉与图像识别
图像识别是人工智能功能技术中发展成熟最快的技术之一,近年来全球发达国家均积极开展该技术与智能化产品和应用的融合研究。从专利申请情况看,中国近年来该技术分支专利申请量高速增长,在生物特征识别、图像识别(通用)和视频识别3个分支上专利申请量最高,特别是在生物特征识别分支上申请量超过了全球其他国家申请量的总和,国内在图像识别领域研究提升的同时,将人脸识别、指纹识别等技术应用于各类产品,输出了大量的应用型专利。
(1)计算机视觉与图像识别专利申请现状
计算机视觉与图像识别主要包括生物特征识别、文字识别、视频识别及各类计算机视觉和图像识别专利申请。随着生物特征识别技术的兴起,2000年后专利申请量开始增长,目前申请量达到4.79万项,在各类技术分支专利申请中申请量最高。
生物特征识别技术又包含人脸识别、步态动作识别、指纹识别、虹膜识别、视网膜识别、掌纹识别、脑电波识别和静脉识别等。当前人脸识别技术是人工智能领域中落地应用最广泛的技术之一,可部署到智能手机、门禁等终端产品中,实现个人安全认证、照片人脸检测和美化处理等功能,并已在机场、车站安检、安防等领域应用,其相关专利申请量占生物特征识别申请量的52.4%,是当前申请的热点。
(2)计算机视觉与图像识别专利申请特点
通过对全球相关专利进行检索分析,将计算机视觉与图像识别专利方案按照算法实现、设备装置和垂直应用3个方向进行分类,主要国家在上述3个方向上的专利申请量均相差较小,针对不同场景和行业需求的专利方案申请同时涵盖了算法模型训练、装置构成和应用场景,已成为人工智能专利技术布局特点。
从全球企业来看,互联网巨头公司注重基础技术+行业应用,布局全面,而初创企业注重深耕专业领域。如美国微软、IBM、谷歌、GE等公司注重在图像识别领域基础研究,专利申请包括以神经网络训练图像识别、物体检测、生物特征识别、视频搜素、动态图像跟踪等各类基础性技术,同时又以图像识别技术为核心拓展在智慧医疗、自动驾驶等领域应用。
(3)计算机视觉与图像识别专利申请趋势
图像识别专利申请路线历经字符识别、OCR文字识别、指纹识别、手势识别、物体识别、人脸识别等阶段,专利布局方向一方面从以生物特征识别、文字识别等静态图像识别向视频识别、运动识别等动态图像识别方向演进,另一方面向着提升识别精度和智能化方向发展,如随着对人脸细微变化识别准确度和要求提升,专利方案已开始关注情绪识别、表情识别等更加细节层面的识别技术,并正成为申请热点。
随着卷积神经网络对图像识别准确率的大幅提升,深度学习技术在图像识别领域的研究受到广泛关注,神经网络基础性算法以及针对场景的模型训练在一定时期内仍是研究和专利申请的热点方向。
3 语音识别与语音合成
语音识别和语音合成是人工智能感知环节的关键技术,包括语音识别、语音合成、语音交互、语音评测、人机对话和声纹识别等技术。
(1)语音识别与语音合成专利申请现状和特点
语音技术研究超过六十年,专利申请经历了萌芽期和较长时间发展期,目前再一次迎来了专利申请高峰。中国近年来在中文语音识别方面进步明显,在国际语音大赛上取得优秀成绩,这一进步也反映到国内在语音识别算法实现类专利申请量占比提高。与计算机视觉与图像识别相似,在提升语音识别算法模型训练准确度的基础上均十分重视与应用场景和产品的结合。
在企业方面,技术型企业优化核心技术的同时积极拓展行业应用。传统技术性公司在开展前沿技术研究的同时,同时拓展技术应用领域。以美国Nuances公司为例,Nuances公司语音专利数量全球第一,近年来专利方案中不乏声纹识别技术在安全领域的应用研究,呈现出技术性企业从语音算法、模型等基础性语音技术向行业场景扩展的趋势。国内科大讯飞在开发基于语音识别引擎产品的同时,拓展教育、电信、消费和安全等领域应用市场。
在布局方面,互联网巨头企业围绕企业核心业务布局,专利方案覆盖面广,初创企业深耕下一代语音识别技术。NUANCE公司在语音领域具有深厚的技术基础,专利方案涵盖了基础神经网络模型到语音搜索、人机对话等相关产品和应用,微软公司语音识别技术已经应用在其Windows产品中,谷歌公司除了在深度学习网络、声学建模、语言模型方面申请专利外,专利布局涵盖到用户认证、虚拟助手、人机对话等应用领域。国内百度、腾讯等国内互联网公司除了在语音识别算法核心技术上投入研究,结合自身业务发展全面布局,专利方案包括长语音识别、远场识别等技术,并涵盖了车载导航、智能家居、智能客服、会议、教学等多个场景下的应用方案。
(2)语音识别技术专利申请趋势
随着语音识别与合成技术的发展,理想环境下语音识别能力问题已经基本解决,针对真实场景如环境噪声下语音识别、多种语言或方言混合识别等正成为当前申请热点。
随着对语音识别性能要求的提高,语音识别技术中的语言模型从统计语言模型(N-Gram)、DNN模型向序列到序列(端到端)处理的模型,即声音模型与语言模型的融合模型方向进行研究。在深度神经网络模型结构上,生成式对抗网络等正成为复杂分布上无监督学习最具前景的方法之一,在这些演进技术的驱动下,深度学习语音识别专利申请将仍会是下一阶段的申请热点。
4 自然语言处理
自然语言处理(Natural Language Processing,NLP)是人工智能认知环节中的关键技术,主要包括自然语言交互、自然语言理解、机器翻译、语义分析、词法分析、句法分析等人类语言环境下的认知技术。
(1)自然语言处理专利申请现状及特点
自然语言处理基础性技术主要与文本和语言的检索、数据库、语法分析、自然语言建模、自然语言数据以及处理和转换相关。中美日韩在这些基础性技术布局各有不同,美日侧重NLP模型数据及转换处理,国内侧重检索和语法分析。
美国侧重在与自然语言处理的模型、数据以及处理和转换相关的专利申请,特别是与自然语言处理的模型和数据相关的专利申请量在中美日韩4个国家中最高,而与NLP处理和转换相关的专利申请量低于日本排名第二。日本在NLP处理和转换发明申请的专利申请量在4国中最高,其数据库及检索技术和语法分析类专利申请量也较为均衡。中国NLP相关专利申请更多侧重在检索技术和数据库,其次是涉及语言或文本的语法分析相关,在自然语言处理与转换、自然语言处理模型等相关专利申请量低于美日韩。
(2)自然语言处理专利布局趋势
随着自然语言处理技术研究进展,相关专利布局已经从基础文本处理、语言建模、机器翻译向更加接近真实场景对话、自动问答系统和阅读理解能力演进。当前涉及智能问答、意图识别等相关专利的年度申请量已逐年上升,并有继续上升的趋势。
基于深度学习提升自然语言理解能力将在一定时期内仍成为专利申请热点。国内外高科技公司正在进行深度神经网络在解决自然语言理解能力方面的研究,如使用递归神经网络处理顺序数据、采用深度学习模型进行语义解析、基于神经网络的机器翻译等,国内浙江大学等高校利用深度神经网络进行文本情感特征提取、基于注意力机制进行知识图谱嵌入等方面正在展开研究。
5 结束语
当前全球高科技企业正在积极开展人工智能技术的研究,美国IBM、微软、谷歌等企业引领人工智能技术创新研究,东芝、佳能、NEC、富士通、三星等日韩企业在人工智能领域具有雄厚基础。我国近年来在人工智能技术部分领域取得了较为显著成绩,百度、腾讯、阿里、中科院、浙江大学、西安电子科技大学等互联网企业、高校科研院所以及科大讯飞、寒武纪等专业公司紧跟技术研究和发展的前沿,积极开展技术突破和专利布局。
从当前人工智能技术专利申请趋势看,不断提升智能化水平和能力是人工智能技术发展方向。作为人工智能基础性功能技术,语音识别、图像识别、自然语言处理技术在现有性能的基础上进一步提高识别准确率,是现阶段专利布局的重点方向。随着人工智能技术不断成熟和优化,落地应用是人工智能技术真正实现发展的关键,从本文所述3个领域的专利申请特点上看到,人工智能技术智能化的提升与应用和场景的结合密不可分,算法与场景的结合是现阶段人工智能技术研究的主要手段之一。
人工智能技术作为一个全球性技术,在促进技术进步和未来产业发展的同时,全球企业越发注重知识产权创造和保护,掌握核心的知识产权是企业在未来人工智能产业化竞争中的关键利器。