人工智能技术的定义范围不清晰、涉及领域广泛、表达形式多样,增加了专利检索分析的难度,不同的分析师基于同样的检索要求得出的结果可能差之千里,近十年该领域的专利申请多达10万件。
人工智能(AI)是当前的科技热点,也是各国专利布局的重要领域,网上也出现很多关于AI的各种专利分析报告,与其他领域不同的是,AI领域的分析报告在数据上差异非常大,尽管每家进行专利检索分析基于的侧重点不同,但基础数据差距几倍甚至十倍还是值得研究的。
AI领域到底有多少专利?到目前为此,根据德温特分类统计,该领域有大概5万个专利家族,共15万件专利,经过补充检索,总共有6万多个专利家族,17万多个专利。当然这里面包括从上世纪五十年代申请的早期人工智能装置以及九十年代的符号学习领域的专利,近十年各国在人工智能方面申请的专利就有5万多个家族,超过10万个专利,但要把这些查全并不容易。为什么人工智能领域的专利检索比较难?
定义范围难以界定
人工智能既涉及算法,也涉及具体的执行机构,例如基于深度学习的无人驾驶,在专利检索的时候,其数据处理平台涉及机器学习算法,这种类型的专利显然属于人工智能领域,但与之密切相关的硬件部分和执行机构,在多大程度上要划分为人工智能领域,专用的芯片、处理器、传感器、执行装置等是否需要包括,范围需要涵盖到哪一级别,这都是需要在专利检索分析时定义好的,否则最后的检索结果会差之千里。
图片来源于网络
涉及的领域广泛
人工智能目前涉及的领域非常广泛,图形识别、语音识别、自然语言处理、无人驾驶、智能机器人、医疗检测与诊断,可谓无孔不入,随着技术的发展快速向更广泛的领域迁移。人工智能在不同领域的应用程度和方式差异较大,例如同样是卷积神经网络在图像识别与自然语言处理上会有不同的方式,如果对其中的差异不清楚的话,用卷积神经网络在图像处理领域抽取的关键词很难定位查全其在自然语言处理方面的专利,一个人知识面很难熟悉每个领域,容易造成漏检。
图片来源于网络
表达形式变化大
人工智能与传统的一些技术领域不同,比如汽车领域,如果要查汽车发动机相关专利数量,不同人得出的结果差异不会太大,因为相应的关键词比较固定,包括气门、火花塞、活塞、曲轴、飞轮、凸轮、油底壳等等,这些词汇都是容易查询和想到的,反应在专利文件中变化也不大,即使申请人在申请时做了一些变体处理,也很容易通过交叉检索和分类定位到。人工智能方面的专利则不同,表达形式变化太多,比如机器学习领域,从不同的角度就有无数种的表达形式,有从监督学习、非监督学习、半监督学习角度表达,有从符号学习、统计学习、深度学习、增强学习角度表达等等,同样的技术内容可以完全不同的形式在专利文件出现。此外机器学习中的众多算法与传统的算法有重叠,比如常用贝叶斯函数、最小二乘法、Sigmoid函数等,这些都不是机器学习中独有的,在非机器学习领域也常用,而这些最重要的概念无法用来准确定位专利,显然给检索增加了不少的难度,这就需要检索人员对相关的算法比较熟悉,否则很难辨别出是否在人工智能领域的应用。
在人工智能领域的一些上下游技术,比如模型训练、应用场景框架等都有大量的专利布局,在权利要求中甚至未提及人工智能的术语,但其应用场景中会用到人工智能的专利也很难准确定义和检索,需要检索人员对技术深度理解并能根据要求进行识别划分,比如亚马逊的语音控制无人机专利,虽然其权利要求未提及机器学习的算法,但很显然这种快速的语音处理和理解是机器学习重要应用场景。
总之,人工智能领域的大量专利申请与布局,增加了专利检索分析的难度,也对专利分析师提出了更高的要求,不同的检索人员基于同样的要求,得出的结果会差之千里,企业很显然需要加大在专利检索分析方面的投入以获得准确的信息和分析结构。