中美欧日在人工智能及机器学习领域的专利审查规定与实例分析
本文梳理中国、美国、欧洲、日本在人工智能及机器学习领域的专利审查规定与实例,分析该领域专利申请的客体、创造性、说明书支持或公开不充分问题。全文约17000字。
人工智能技术在工业上的应用日趋广泛,从图像识别、自然语言处理、自动驾驶、疾病诊断等领域逐渐纵深发展,人工智能很可能同20世纪的通信与互联网技术一样,成为现代工业系统不可或缺的重要部分。在人工智能及机器学习领域的知识产权保护也是各国重点关注的话题,全世界的高科技企业在相关领域布局了大量的专利申请。笔者曾做过统计,在全球涉及到人工智能的专利申请已经超过几十万件,直接在专利的独立权利要求中涉及机器学习主题的专利家族已经超过两万个,这个数字还呈高速增长的趋势。
但是人工智能的专利申请在授权方面却遇到了很多问题,人工智能的核心部分是机器学习算法,专利申请也主要集中在这一领域。这些算法或计算机程序很多体现为数学模型,在多数国家都不是专利保护的客体。欧盟的专利审查指南指出神经网络等机器学习算法或计算模型具有数学的本质,审查时需要重点关注;美国在修订审查指南前,在专利审查实践中,计算机程序常被划分为抽象的概念,属于不适格的专利客体。关于计算机程序与相关工业技术相结合的方案,目前在各国都具有可专利性,但是在评价创造性方面,各国的态度又差异明显。
目前人工智能的专利主要集中在中国、美国、欧洲、日本这个四个国家或地区,但是各国专利法对人工智能领域的专利审查规定都不尽相同,这给许多企业带来了困扰。目前日本、美国、欧洲针对人工智能及机器学习领域的专利形势修改了审查指南,主要有三大方面的问题?
1、客体问题:
在人工智能及机器学习领域,哪些方案能够成为可专利性的客体?机器学习中有关训练数据、核心算法改进的专利能否获得授权?
2. 创造性问题:
创造性是专利获得授权的关键障碍,在人工智能技术的应用场景专利中,创造性评价问题变得尤为突出,如果相关的机器学习算法是已知的,应用场景的技术也是已知的,将机器学习的算法应用到新的场景中,这样的技术方案创造性如何克服?
3. 公开不充分与说明书支持问题:
在许多专利申请中,算法有时作为一个整体的模块,或称为“黑匣子”件,比如应用机器学习算法的肿瘤诊断装置,有时候权利人为得到更宽的保护范围,会在权利要求中直接写“如权利要求X的设备,所述设备通过机器学习的算法控制。”这样的权利要求如何得到支持?说明书或权利要求如何才能做到公开充分?
人工智能及机器学习领域的专利申请大部分都是最近几年提交的,绝大部分申请都在审查或等待审查中,授权的比例相对较低。在审查实践,不少专利都在这三个问题上遇到了很多困难。中国、美国、欧洲、日本四个国家或地区的规定也不同,这让申请人很难把握。到目前为止,中国尚未出台针对人工智能及机器学习方面的审查指南,相关领域的审查参照计算机实施专利的规定,美国、日本与欧洲已经修订了审查规定,其中日本的规定最为详细。笔者将逐一分析各国或地区在这一领域的审查规定与相关实例。
一、日本在人工智能及机器学习领域的审查规定与实例:
2018年3月份,日本专利局公开了针对人工智能及机器学习方面的审查指南实例,内容非常具体详细。(注:本文的英文翻译均是笔者为读者阅读方便提供的粗略翻译,有些翻译甚至是直接在Google翻译的基础上修改而成的,准确的意思请参考英文原文)
1. 关于客体:
日本的指南示例2-14介绍了一种分析宿舍声誉的训练模型,权利要求如下:
1.一种基于宿舍的声誉的文本数据促使计算机用于输出合格的宿舍声誉值的训练模型,其特征在于,所述模型包括第一神经网络与第二神经网络,以所述第二神经网络从所述第一神经网络接收输出的方式连接;
所述第一神经网络包括特征提取神经网络的输入层到中间层,其中至少一个中间层的神经元数量小于所述输入层的神经元的数量,所述输入层的神经元的数量与所述输入层的数量相同,训练权重使得输入到输入层的每个值与从输出层输出的每个对应的值变得相等;
不改变所述第一神经网络的权重,训练所述第二神经网络的权重;
响应于从输入到所述第一神经网络的输入层的宿舍声誉的文本数据中获得的特别词的出现频率,基于所述第一与第二神经网络的所述训练权重,所述模型促使计算机用于执行计算,并从所述第二神经网络的输出层输出宿舍声誉的合格值。
这件申请的主要内容是利用神经网络处理文本信息,通过对文本数据中反映宿舍声誉的特别词汇出现的频率进行分析。权利要求的核心是计算机程序,日本的专利审查指南认为这样的技术方案是可专利的客体,理由是“由于通过使用硬件资源具体地实现了软件的信息处理,因此权利要求1的训练模型是利用自然法则的技术思想的创造,因此属于“发明”。
但是这个示例并不是纯粹的算法权利要求,因为还涉及到反映宿舍声誉的文本数据。笔者检索了下,发现日本专利局目前已经授权了不少纯粹人工智能算法的专利。例如授权专利号为JP6209879B2的日本专利,权利要求1的内容如下:
这件也进入了中国,中文的权利要求与日文的有些不同,但都只涉及算法,因此我们直接援引这件专利的中文权利要求:
1.一种卷积神经网络分类器系统,包括:
不同类型的M种卷积神经网络分类器,M为大于1的整数;
其中,每一种卷积神经网络分类器包括多个相互同构的卷积神经网络分类器,
其中,不同类型的卷积神经网络分类器选自:
a)空间线性采样型卷积神经网络分类器;
b)随机省略一部分层间连接的空间线性采样型卷积神经网络分类器;
c)空间非线性采样型卷积神经网络分类器;
d)随机省略一部分层间连接的空间非线性采样型卷积神经网络分类器;
e)没有空间采样层的卷积神经网络分类器;以及
f)随机省略一部分层间连接的没有空间采样层的卷积神经网络分类器,
其中,将所述不同类型的M种卷积神经网络分类器布置为M级的级联结构,
其中,第一级卷积神经网络分类器用于对对象进行分类;
在所述第一级卷积神经网络分类器难以对对象进行分类的情况下,第二级卷积神经网络分类器用于对所述对象进行分类;以及
对所述第二级卷积神经网络分类器至第M级卷积神经网络分类器中的所有两个相邻级别依次重复前述操作。
虽然权利要求提到分类器等概念,但方案整体属于计算机程序,也未涉及到处理其他物理对象,但在日本获得了专利授权,可见日本专利局对人工智能领域的算法专利还是相对宽容的,关于人工智能领域的训练模型、核心算法的改进,在日本是适格的专利客体。
2. 关于创造性:
关于创造性的评价,日本专利局的审查指南介绍了一种癌症水平计算装置,权利要求1如下:
1.一种使用受试者的血液样本来计算受试者患有癌症的可能性的癌症水平计算装置,包括:
响应于通过受试者的血液分析获得的A标记和B标记的测量值的输入,计算受试者患有癌症的可能性的癌症水平计算单元;
所述癌症水平计算单元包括神经网络,所述神经网络通过使用训练数据的机器学习训练,响应于A标记和B标记的测量值的输入,以计算估计的癌症水平。
日本专利审查指南认为这样的权利要求缺乏创造性,理由是“现有技术中存在这样的方案:一种癌症水平计算方法,医生对受试者的血液样本分析来计算受试者患有癌症的可能性,包括使用通过受试者的血液分析获得的A标记和B标记的测量值来计算受试者患有癌症的可能性的步骤。在机器学习领域中,使用训练的神经网络,基于受试者的数据输入计算受试者患有某种疾病的可能性,这些输入的数据可能是人的生物数据,输出数据是患有疾病可能性的数据,这些都是众所周知的,因此该专利缺乏创造性。”
这表明,根据日本专利局的审查指南,如果技术特征与人工智能算法相结合的发明,即利用人工智能算法解决技术问题,如果相关的技术手段是已知的,而采用的人工智能算法也是已知,仅仅是已知的算法应用到新场景中,算法和技术手段都未获得改进,这样的专利是缺乏创造性的。
在另一个示例中,技术方案涉及到痴呆阶段评估装置,权利要求如下:
1.一种痴呆阶段评估装置,包括:
语音信息获取装置,用于获得提问者和答复者之间对话的语音信息;
语音信息分析装置,用于分析语音信息,然后标定提问者的语音部分和答复者的语音部分;
语音识别装置,用于通过语音识别,将提问者的语音部分和响应者的语音部分的语音信息转换成文本,然后输出字符串;
问题主题标定装置,用于根据语音识别的结果通过提问者标定问题主题;及
痴呆阶段确定装置,用于将提问者问题主题于响应者针对所述问题主题的语音部分的字符串以相互关联的方式输入到训练的神经网络,然后确定答复者的痴呆阶段;
其特征在于,所述神经网络使用训练数据通过机器学习进行训练,以便响应于答复者的语音部分的字符串与提问者的问题主题相关联,来输出评估的痴呆阶段。
现有技术的文件是这样的一种痴呆阶段评估装置,包括:
语音信息获取装置,用于获得关于提问者和答复者之间的对话的语音信息;
语音识别装置,用于通过语音识别将语音信息转换为文本并输出字符串;及
痴呆阶段确定装置,用于向训练的神经网络输入已由语音识别装置转换成文本的字符串,然后确定答复者的痴呆阶段,其中,通过机器学习使用训练数据训练神经网络,以便响应于字符串的输入输出评估的痴呆阶段。
日本专利局认为该专利相对于现有技术具有创造性的原因在于,“本领域技术人员通过某种预处理修改训练数据,这种训练数据是用于机器学习的神经网络的输入,以便提高神经网络的估计精度。现有技术中未公开这样的技术特征,用于将提问者问题主题与答复者针对所述问题主题的语音部分的字符串以相互关联的方式输入到训练的神经网络,然后确定答复者的痴呆阶段的技术,这也不是一般的技术常识。权利要求1的发明带来了显着的效果,即通过将提问者问题主题和答复者的答复(对应的字符串)以相关联的方式标定,进行高度准确的痴呆阶段评估。”
这件申请具备创造性的关键在于训练数据的预处理,将提问者的问题主题与答复者答复的字符串进行关联,这个关联是现有技术未披露的,即使现有技术已经披露了利用神经网络进行痴呆阶段评估的技术方案,该发明依然具有创造性。
根据日本专利局的审查指南中案例分析,人工智能领域的技术方案若要具备创造性,必须在以下两个方面具有改进,一是在技术上或者算法上具有本领域技术人员不容易预测的特征,这可以表现为训练数据的预处理;二是在算法有新的改进。而只是将已知的算法应用到新场景中,相关的场景中采用的技术手段也是已知,取得的技术效果也是可以预测的,相关的发明缺乏创造性。
3. 关于公开不充分与说明书支持:
日本的专利审查指南介绍了一种体重评估系统,权利要求1与权利要求2如下:
1. 一种体重评估系统,包括:
用于生成评估模型的模型生成装置,所述评估模型基于表示人的面部形状和身高的特征值,通过使用包含表示面部图像的特征值以及人的高度和体重的实际测量值训练数据的机器学习,评估人的体重;
接收装置,用于接收人脸图像和身高的输入;
特征值获得装置,用于通过分析由接收装置接收的人的面部图像来获得表示人的面部形状的特征值;及
处理装置,用于根据特征值获得装置接收的人的面部形状的特征值和接收装置接受的所述人的身高,使用通过所述模型生成装置生成的估计模型输出人体重的评估值。
2.如权利要求1所述的体重评估系统,其特征在于,表示脸部形状的特征值是脸部轮廓角度。
针对权利要求1,日本专利局的审查指南指出,“说明书仅公开了可以从面部图像获得并使用除表示面部形状的面部轮廓角之外的任何特征值。未公开(i)表示面部形状的面部轮廓角以外的特征值与(ii)人的身高,体重等以及基于这些的BMI之间的相关性等。此外,即使考虑提交时的共同的一般公知常识,也不能假定存在这种相关性等。在实践中也未公开使用除表示面部形状的面部轮廓角之外的特征值生成的估计模型的性能评估结果。
因此,该描述没有为本领域技术人员提供足够的公开内容以认识到可以基于身高和表示面部形状的任何特征值来获得体重估计。换言之,说明书的范围不能扩展或概括为权利要求1的发明的范围,其中输出到体重的评估值的评估模型的输入仅由身高和表示人脸图像中的脸部形状的值确定。因此,权利要求1超出了说明书支持的范围。”
关于权利要求2,日本专利局的审查指南指出:“说明书该公开了在脸部轮廓角的余弦与人的BMI之间存在统计上显著的相关性。
基于说明书中的公开内容,本领域技术人员可以认识到身高和体重与面部轮廓角度之间存在一定程度的相关性,并且可以使用通用机器学习算法生成估计模型。训练数据包含身高,体重和面部轮廓角的实际测量值。因此,可以使用上述估计模型来制作体重估计系统,其响应于人的面部轮廓角度和身高的输入来估计人的体重。
因此,该说明书以本领域技术人员可以制造和使用该系统的方式公开了权利要求2中的“体重估计系统”。换句话说,该说明书为本领域技术人员实施本发明提供了清楚和充分的公开内容。权利要求2的发明在说明书中得到公开,权利要求2满足支持要求。”
日本专利审查指南介绍的示例48中,介绍了一种具有驾驶员监控装置的自动驾驶车辆,权利要求如下:
1.一种具有驾驶员监控装置的自动驾驶车辆,所述驾驶员监控装置包括:
获取由成像装置拍摄的图像的图像获取单元,所述成像装置定位以拍摄坐在车辆座椅中的驾驶员的图像;及
快速反应能力评估单元,其将所拍摄的图像输入到训练的学习装置,并且从训练的学习装置获得表示驾驶员在车辆操作期间的快速反应能力的快速反应能力分数,所述训练的学习装置通过机器学习训练以评估驾驶员在车辆操作期间的快速反应能力,
其特征在于,在获得的快速反应能力得分不满足预定条件的情况下,禁止从车辆在自动操作的自动驾驶操作模式切换到车辆由驾驶员手动操作的手动操作模式。
日本专利审查指南指出“根据一般技术知识,本领域技术人员可以推定拍摄的驾驶员行为与对车辆操作的快速反应能力之间存在某种关系。”
根据日本专利局的审查指南示例,“在人工智能的相关技术领域,用于机器学习的包含多种数据的训练数据,一般要满足如下两个条件,基于说明书中的公开内容,可以认识到存在某种关系的条件,例如多种类型的数据之间的相关性,或者根据一般的技术知识,可以推测多种类型数据之间存在关系。”
也就是说,说明书一般要公开输入数据与输出数据之间的关联性,除非这种数据的关联性是本领域技术人员可以推测的。
二、欧洲在人工智能及机器学习领域的审查规定与实例:
欧洲专利局在2018年出台针对人工智能及机器学习领域的审查指南,规定如下:
人工智能和机器学习基于用于分类,聚类,回归和降维的计算模型和算法,例如神经网络,遗传算法,支持向量机,k均值,核回归和判别分析。这些计算模型和算法具有抽象的数学性质的本质,不管它们是否可以基于训练数据“训练”。因此,G-II,3.3中提供的指南通常也适用于这种计算模型和算法。
在审查所要求保护的主题是否在整体上具有技术特征时(第52(1),(2)和(3)条),诸如“支持向量机”,“推理引擎”或“神经网络”之类的表达必须仔细看,因为它们通常指的是缺乏技术特征的抽象模型。
人工智能和机器学习在各种技术领域中得到应用。例如,在心脏监测设备中使用神经网络以识别不规则的心跳是一种技术贡献。基于低级特征(例如,图像的边缘或像素属性)的数字图像、视频、音频或语音信号的分类是分类算法的进一步典型技术应用。然而,仅仅就其文本内容对文本文档进行分类不视为技术目的而是语言目的(T1358/09)。对抽象数据记录或甚至“电信网络数据记录”进行分类而没有任何对所得到的分类进行技术使用的指示也不是技术目的,即使分类算法可被认为是有价值的数学特性,例如鲁棒性(T1784/06)。
在分类方法用于技术目的的情况下,如果它们支持实现该技术目的,生成训练集和训练分类器的步骤也可以有助于本发明的技术特性。
欧洲专利局这个规定还是相对严格的,在可专利性的客体上,单纯的机器学习算法申请无法获得授权,对于“支持向量机”或“神经网络”之类的表达还要重点关注,明确指出单纯这些算法缺乏技术特征。对于算法与技术特征相结合的情况,例如在心脏监测设备中使用神经网络以识别不规则的心跳,基于低级特征对图像、视频、音频或语音信号的分类是分类算法的都是技术应用。但是基于文本信息的文本分类不认为是技术使用。在判断创造性上,欧洲专利局认同分类方法在用于技术目的时的技术贡献,换言之,在分类方法或者训练集用于技术目的时,分类方法或者训练集带来的技术贡献可以用于评价创造性。
欧洲专利局的指南并未公开相关的典型示例,笔者检索了欧洲专利局相关的授权的案例。
1. 关于客体:
欧洲授权专利号EP1770612B1,涉及一种计算机实现的方法,独立权利要求1如下:
1.一种计算机实现的方法,用于使用多个处理节点并行地训练支持向量机,以及基于一组训练数据连接到处理节点的网络的集中处理节点,所述处理节点的每个存储核矩阵的子集,包括以下步骤:
a)在多个处理节点中的每个,基于所述训练数据集选择训练数据的本地工作集;
b)在多个处理节点中的每个,将与所述本地工作训练数据集相关的所选数据发送到所述集中处理节点,所述选择的数据包括所述本地工作训练数据集的梯度;
c)在多个处理节点中的每个,在所述集中处理节点处,基于从多个处理节点发送的数据,接收所选择的全局工作训练数据组的标识,所述标识由所述集中处理发送节点;
d)在多个处理节点中的每个,通过执行二次函数来优化所述全局工作训练数据集;
e)在多个处理节点中的每个,更新所述全局工作训练数据集的梯度子集,更新步骤包括计算核矩阵的子集,其中所述梯度子集对应于所述核矩阵的子集;及
f)重复所述步骤a)至e)直到满足收敛条件,收敛条件为Karush-Kuhn-Tucker条件。
这是关于支持向量机的算法,这件专利申请于2006年,是比较早期的人工智能算法,权利要求在完全属于算法的改进,并未涉及到传统意义上的“技术特征”,该申请2016年在欧洲获得授权。
欧洲专利申请号EP3291146A,涉及用卷积神经网络对数据分类的方法,权利要求1如下:
1.一种用于卷积神经网络- CNN -对输入数据进行分类的方法,包括:
在CNN对输入数据进行分类之后,对所述CNN的卷积滤波器执行标记处理,所述标记处理有助于输入数据的分类,所述标记处理包括将卷积滤波器的输出和/或与卷积滤波器相关联的最大池滤波器的输出,输入到滤波器分类器中,所述滤波分类器采用输入数据分类处理,以将标签分配给由卷积滤波器表示的输入数据的特征;
重复关于CNN有助于输入数据的分类的每个单独卷积滤波器的标记过程;
将CNN转换为与指定标签相关联的神经符号网络;
使用知识提取方法从与CNN对输入数据的分类有关的神经- 符号网络知识中提取;及
生成并输出以下中的至少一个:包括输入数据的摘要、由CNN分配的输入数据的分类、以及提取的知识;并且请求使用提取的知识和分类的输入数据来指示动作或任务的执行的警报。
欧洲审查员认为该权利要求1的客体不适格,驳回了该专利申请,理由是方案直接指向基于使用一定数学或抽象模型(卷积神经网络、滤波分类器、神经符号网络),权利要求的步骤执行未规定任何的技术手段。极少的术语可以解释为技术特征(例如警报)也无进一步的指定和技术特征。
可见欧洲专利局对涉及人工智能算法的专利,对于客体问题整体上是比较严格的,直接涉及人工智能算法申请的一般不能授权,审查指南也是明确这样规定的,这也导致进入欧洲的相关专利申请比在美国、日本、中国要少得多。但在审查实践中,欧洲专利局对于涉及算法的权利要求并不是铁板一块,对于与技术手段相结合的权利要求,比如涉及图像处理的算法,显然是适格的,对于那些权利要求完全是算法的专利也有授权的先例,虽然这些例子屈指可数。目前欧洲授权的几件纯算法的专利基本上都是涉及数据训练和分类的,这一点值得研究。此外根据欧洲专利局审查员对客体问题的规定,进入欧洲的权利要求,对涉及算法的部分,要有技术术语,而这些技术术语需要技术特征化,如果技术术语仅仅当成一种的符号也难以看成“技术特征”。
2. 关于创造性:
欧洲授权专利EP2932444(B1),一种机器学习系统中的计算机实现的方法,权利要求1如下:
1.一种机器学习系统中的计算机实现的方法,包括:
在处理器处,对于可以分配机器学习系统的资源的多个选项(100)中的每一个,接收描述选项(100)的行为的多个样本(110),样本的数量至少部分基于自动确定的容错度;
对于每个选项(100),使用样本计算(308)得分,得分包括有界差分统计;
对于每个选项(100),使用样本计算得分的置信区间;
对于所述选项,所述分数加上或减去一常量与所述分数的所估计的方差乘以二与所述容错度的商的对数的平方根的乘积;
基于所述置信区间和分数选择一个或多个选项(100),基于置信区间选择一个或多个选项(100),包括:
确定所述多个选项中的最高得分选项(100);
比较最高得分选项的置信区间与多个选项中不同选项的置信区间(100);及
当最高得分选项的置信区间与不同选项的置信区间不重叠时,排除进一步考虑的不同选项;及
将机器学习系统的资源分配给所选择的一个或多个选项。
该专利的申请人是美国微软公司,在美国的权利要求与此稍微不同,但直接被驳回,理由是方案属于抽象的概念,不是可专利性客体。该专利2019年1月份刚在欧洲获得授权, 审查员认为在申请文件的权利要求缺乏创造性,下图是申请人为克服创造性缺陷修改的权利要求,增加了关键特征是“所述分数加上或减去一常量与所述分数的所估计的方差乘以二与所述容错度的商的对数的平方根的乘积”,这是一个典型的数学公式。这也说明欧洲专利局的在审查人工智能算法相关专利时,是认可算法的技术贡献的。
3. 关于公开不充分与说明书支持:
在这个问题上,欧洲专利局与日本专利局的态度类似,权利要求书要得到说明书的支持,权利要求书或说明书必须完整公开发明实现所需要的技术特征。在人工智能领域的专利中,除非本领域技术人员公知的常识,相关技术方案必须公开输入数据与输出数据的关联性,否则算法就可能成为“黑匣子”件,权利要求会超范围。这一点日本专利审查指南的示例表达地非常清楚,其他几个国家或地区在审查实践中把握的尺度基本一致,限于篇幅,本文对于这个问题不再赘述。
三、美国在人工智能及机器学习领域的审查规定与实例:
1.关于客体:
2019年1月日,美国专利商标局(USPTO)发布了修订的专利客体适格指南,USPTO局长AndreiIancu说“适格的专利权对美国的经济增长至为关键,提供高质量、高效的专利申请审查将更好地服务美国经济”。
根据美国专利法101条规定:“无论是发明或发现任何新的和有用的过程,机器,产品或物质组成,或任何新的和有用的改进,符合本标题的条件和要求,都可以获得专利权。”但属于“司法例外”的自然法则、物理现象、与抽象概念不可以获得专利权。
在指南修订之前,在审查实践中,人工智能及机器学习的算法常被直接划为抽象的概念,不具有可专利性。2014年美国最高院在AliceCorp. v. CLS Bank案中采用两步分析法(即Alice/Mayo测试)确定计算机程序是否可以作为适格的专利客体问题。第一步,法院确定审查的专利权利要求是否包含抽象概念,例如算法,计算方法或其他一般原则,如果不是,则说明该权利要求有可专利性的可能,但须符合专利法的其他要求。在第二步,法院确定该专利是否会增加体现“创造性概念”的“额外的”元素,将权利要求的本质转换为适格的专利申请。
Alice Corp. v. CLS Bank案中争议的权利要求如下
一种在各方之间交易义务的方法,各方保留与交易机构的贷方记录与借方记录以交易预定义务,所述方法包括以下步骤:
”(a)创建利益相关方的影子贷方记录和影子借方记录由来自交易机构的监管机构独立持有;“(b)从每个交易机构获得每个影子贷方记录和影子借方记录的日终余额;
“(c)对于导致交易义务的每笔交易,监管机构调整各方的影子贷方记录或影子借方记录,任何时候只允许不会导致影子借方记录值小于影子的贷方记录值的交易。每个所述调整按时间顺序发生,以及
“(d)在当天结束时,交易机构的监管机构指示[e]根据上述允许的交易的调整,将各方的贷或借转换成贷方记录和借方记录,贷和借不可撤销,时间恒定的义务放在交易机构。
通俗的说,这个专利的核心技术方案就是第三方交易机构先给借方和贷方创建一个虚拟的影子账户,双方先虚拟交易下,当交易机构确保账户上的资金足够时才允许正式交易。美国最高法院最终判决该专利属于抽象的概念,不属于适格的专利客体。
在Alice案之后,美国针对计算机程序类的审查更加严格,USPTO颁布了修改了指南,根据该指南,审查员在判断适格专利客体时采用两步测试:
步骤1:权利要求是过程,机器,产品或物质组成?
步骤2A:确定权利要求是否指向抽象的概念。
步骤2B:确定在权利要求中的任何部件或部件的组合是否足以确保权利要求达到明显超过抽象的概念本身。
在以前的审查实践中,许多专利申请在中国、欧洲、日本都未遇到客体问题,在美国却被因为客体不适格被驳回。例如微软的专利申请US20140172753A1,一种机器学习系统处的方法,权利要求1如下:
1.一种机器学习系统处的方法,包括:
对于多个选项中的每一个,在处理器处接收描述该选项的行为的多个样本;
对于每一个选项,使用所述样本来计算分数,所述分数包括有界差分统计数据;
对于每一个选项,使用所述样本来计算所述分数的置信区间;
在所述置信区间和所述分数的基础上选择所述选项中的一个或多个。
权利要求1是用于手势图像的识别机器学习算法,在欧洲、中国、日本,审查员都未对客体提出质疑,但是在美国直接被驳回,审查员认为这是抽象的概念。
总体上,在审查指南修改前,美国关于纯算法的专利申请获得授权的极少,一般权利要求中需要加入技术特征,否则容易被驳回。但也有个别的反例,标准不统一,比如雅虎在美国的授权专利US9805305B2,权利要求就是卷积神经网络的算法。
1.一种方法,包括:
通过增强过程训练多类卷积神经网络(CNN)的集合,所述增强过程包括至少一个增强迭代以利用辅助CNN,所述辅助CNN与所述集合集成作为线性组合,该线性组合至少部分地基于在训练期间遇到的增强预测误差与所述集合的子集。
2.如权利要求1所述的方法,还包括:复制所述辅助CNN并在下一次增强迭代中在所述集合中包括所述辅助CNN。
3.如权利要求2所述的方法,还包括:执行所述增强直到收敛。
按照美国专利局在其他类似案例上标准,这个权利要求无疑是要被当成抽象的概念的,但是却最终获得了授权。
鉴于审查实践中的标准不一致,不清晰,特别是涉及人工智能及机器学习算法的发明,两步法分析遇到了很多苦难,相当一部分该领域的专利申请都因为客体问题被驳回。在这样的背景下,美国2019年初发布了新修改的审查指南。针对专利客体的审查做出了新的规定,将步骤2A分成两小步Prong1与Prong2。
首先评估权利要求是否引用了司法例外的情况(2019年指南中列举的抽象概念、自然法则或自然现象)。若权利要求没有引用任何的“司法例外”,则符合专利客体要求。如果引用了“司法例外”,请转到Prong2步骤。在Prong2步骤,评估权利要求是否引用了将“司法例外”整合到实际应用的其他元素。若所述的例外被整合到实际应用中,则该权利要求是适格的专利客体。若“司法例外”没有整合到实际应用中,权利要求将指向到“司法例外”,转到步骤2B进行进一步分析。此外新修订的审查针对司法例外中的“抽象的概念”的分组做了修改,包括数学概念、组织人类活动的特定方法、心理过程。
美国在修订的审查指南中增加了几个示例(37-42), 例外示例37权利要求如下:
1. 一种在计算机系统的图形用户界面(GUI)上重新排列图标的方法,该方法包括:
通过GUI接收用户选择以基于特定标准组织每个图标,其中特定标准是每个图标的使用量;
由处理器确定在预定时间段内每个图标的使用量;和
基于所确定的使用量,将最常用的图标自动移动到最靠近计算机系统的开始图标的GUI上的位置。
这是一种重新排列界面图标的方法,按照的新的审查标准,步骤如下:
步骤1:是法定类别吗?(101条规定的过程、机器、产品及物质组成)
该权利要求引用一些列步骤,因此属于过程。
步骤2A-Prong1:引用了“司法例外”(抽象概念等)
该权利要求描述了在预定时间段内确定每个图标的使用量的限制。但除了“通过处理器”叙述之外,权利要求中的任何内容都不排除是在头脑中实际执行的步骤。因此,该权利要求叙述了一个心理过程。
步骤2A-Prong2:该权利要求叙述通过GUI接收用户选择,以基于每个图标的使用量将最常用的图标移动到特定位置,权利要求整体上将心理过程整合到实际应用中,提供了对现有系统的特定改进,从而产生用于电子设备的改进的用户界面。因此,该权利要求是适格的,不属于司法例外。
从上述示例明显看出,美国的新指南明显放宽了适格客体的范围,将步骤2A分成两小步,这就相当于以前许多在步骤2A被驳回的申请,多了一些机会,客体不适格的范围必然减小,但由于审查指南刚修改,目前还不看到审查的实例,具体的执行情况我们拭目以待。
2. 关于创造性:
美国专利授权号US9691020B2,涉及用于使用深度神经网络的语音识别的训练方法,权利要求1如下:
1.一种用于使用深度神经网络的语音识别的训练方法,所述深度神经网络被配置为针对所述多个类别、类别独立的子网络中的每个,以将语音对象识别分类到多个类别使用,所述方法包括:
在非瞬态计算机可读媒介上存储第一子网,第二子网和第三子网;和
用处理器训练所述第一子网,所述第二子网和所述第三子网,其训练数据属于所述多个类别的第一类别和第二类别;
其特征在于,训练所述第一子网和所述第二子网包括:
训练通过将所述第二子网连接到所述第一子网的输出侧而形成的第一深度神经网络,所述训练数据属于所述第一类别;
训练通过将所述第三子网连接到所述第一子网的输出侧而形成的第二深度神经网络,所述训练数据属于所述第二类别;
在完成第一深度神经网络的训练和第二深度神经网络的训练之后,分离来自其他子网络的所述第一子网络并且在所述非瞬态计算机可读媒介中存储所述第一子网络作为所述类别- 独立的子网络。
该专利在申请时的权利要求并无“语音”的特征,审查员认为这属于抽象的概念,不能授予专利权,后来申请人修改了权利要求,加入了“语音”的特征,克服了客体问题。审查员认为权利要求中“训练通过将所述第二子网络连接到所述第一子网络的输出侧而形成的第一深度神经网络,所述训练数据属于所述第一类别;训练通过将所述第三子网络连接到所述第一子网络的输出侧而形成的第二深度神经网络,所述训练数据属于所述第二类别;在完成第一深度神经网络的训练和第二深度神经网络的训练之后,分离来自其他子网络的所述第一子网络并且在所述非瞬态计算机可读媒介中存储所述第一子网络作为所述类别- 独立的子网络。”的特征是显而易见的,但申请人争辩成功,克服了创造性问题。这也说明USPTO认同算法在实现技术目的中的贡献,即算法的改进可以用来评价创造性。
3.公开不充分与说明书支持:
略
总体上,在审查指南修改,美国目前针对人工智能及机器学习领域的专利审查标准并不清晰,对客体相对比较严格,单纯的算法会被当成抽象的概念,新修改的指南对客体问题放宽了态度,有利于人工智能及机器学领域的专利授权。
四、中国在人工智能及机器学习领域的审查规定与实例:
中国尚未针对人工智能及机器学习领域的专利申请修改审查指南,关于该领域的专利客体问题,根据专利法第二条第二款,专利法第二十五条第一款规定审查。《审查指南》第九章第2部分涉及计算机程序的发明专利申请的审查基准:“审查应当针对要求保护的解决方案,即每项权利要求所限定的解决方案。根据专利法第二十五条第一款第(二)项的规定,对智力活动的规则和方法不授予专利权。涉及计算机程序的发明专利申请属于本部分第一章第4.2节所述情形的,按照该节的原则进行审查:(1)如果一项权利要求仅仅涉及一种算法或数学计算规则,或者计算机程序本身或仅仅记录在载体(例如磁带、磁盘、光盘、磁光盘、ROM、PROM、VCD、DVD或者其他的计算机可读介质)上的计算机程序本身,或者游戏的规则和方法等,则该权利要求属于智力活动的规则和方法,不属于专利保护的客体。如果一项权利要求除其主题名称之外,对其进行限定的部内容仅仅涉及一种算法或者数学计算规则,或者程序本身,或者游戏的规则和方法等,则该权利要求实质上仅仅涉及智力活动的规则和方法,不属于专利保护的客体。例如,仅由所记录的程序本身限定的计算机可读存储介质或者一种计算机程序产品,或者仅由游戏规则限定的、不包括任何技术性特征,例如不包括任何物理实体特征限定的计算机游戏装置等,由于其实质上仅仅涉及智力活动的规则和方法,因而不属于专利保护的客体。但是,如果专利申请要求保护的介质涉及其物理特性的改进,例如叠层构成、磁道间隔、材料等,则不属此列。”
1.关于客体:
专利授权公开号CN107273429B,涉及一种基于深度学习的缺失值填充方法及系统,授权的权利要求1如下:
1.一种基于深度学习的缺失值填充方法,其特征在于,包括以下步骤:
(1)对数据集进行预处理,将所述数据集分为完整数据子集和缺失数据子集,将所述完整数据子集中的数据分为训练样本集和测试样本集,随机删除测试样本集中部分数据作为缺失测试样本集;
(2)利用所述训练样本集对初步构建的卷积神经网络进行训练并保存,使用训练后得到的卷积神经网络对缺失测试样本集进行缺失值填充,并将填充结果与所述测试样本集比对,在不符合精度要求时调整所述卷积神经网络的网络结构并迭代前述训练和验证步骤直至满足精度要求;
(3)将所述完整数据子集输入步骤(2)得到的卷积神经网络,得到完善的卷积神经网络;
(4)将所述缺失数据子集输入步骤(3)得到的完善的卷积神经网络完成缺失值的填充。
专利授权公开号CN103679185(B),涉及一种卷积神经网络分类器系统,权利要求如下:
1.一种卷积神经网络分类器系统,包括:
不同类型的M种卷积神经网络分类器,M为大于1的整数;
其中,每一种卷积神经网络分类器包括多个相互同构的卷积神经网络分类器,
其中,不同类型的卷积神经网络分类器选自:
a)空间线性采样型卷积神经网络分类器;
b)随机省略一部分层间连接的空间线性采样型卷积神经网络分类器;
c)空间非线性采样型卷积神经网络分类器;
d)随机省略一部分层间连接的空间非线性采样型卷积神经网络分类器;
e)没有空间采样层的卷积神经网络分类器;以及
f)随机省略一部分层间连接的没有空间采样层的卷积神经网络分类器,
其中,将所述不同类型的M种卷积神经网络分类器布置为M级的级联结构,
其中,第一级卷积神经网络分类器用于对对象进行分类;
在所述第一级卷积神经网络分类器难以对对象进行分类的情况下,第二级卷积神经网络分类器用于对所述对象进行分类;以及
对所述第二级卷积神经网络分类器至第M级卷积神经网络分类器中的所有两个相邻级别依次重复前述操作。
上述两件授权专利的权利要求都属于人工智能算法的改进,并未涉及到具体的传统技术特征,但同样获得授权,这也说明相关的审查标准并不必然排除单纯的算法。
2.关于创造性:
专利授权公开号为CN104850864A,一种基于卷积神经网络的非监督图像识别方法,权利要求1如下:
1.一种基于卷积神经网络的非监督图像识别方法,主要包括步骤:
步骤S1,建立带有5层卷积层和3层全连接层的卷积神经网络,其中最后一层全连接层与输入图像维度相同,该网络所有权重均随机初始化。
步骤S2,在卷积神经网络的特征层(第一个全连接层)加入类内约束函数,使同类样本靠近其聚类中心。加入的类内约束与样本重建函数一起构成卷积网络的目标函数。
步骤S3,将所有样本随机分组,并分别通过卷积神经网络映射到特征空间,然后计算所有组的特征表达的平均值,作为该组的聚类中心。
步骤S4,利用S2中的目标函数训练卷积神经网络,更新网络权重,进行非监督图像识别网络的训练。
步骤S5,利用S4得到的更新后的网络,计算所有样本的特征表达,与之前的聚类中心进行比较,将样本分配至距离最近的聚类中心。
步骤S6,利用S5中得到特征表达按新的分组计算每组的特征表达的均值作为新的聚类中心。
步骤S7,利用S6中更新的聚类中心代替S2中目标函数的聚类中心。
步骤S8,转到S4并循环,直到达到训练次数或者非监督图像识别网络收敛。
审查员认为权利要求1的技术方案与对比文件的区别在于,对比文件基于深度神经网络的图像识别,本申请基于卷积神经网络的图像识别;建立带有5层卷积层和3层全连接层的卷积神经网络,其中最后一层全连接层与输入图像维度相同;网络训练终止条件为识别网络收敛,基于上述区别特征,权利要求相对于对比文件实际解决的技术问题是将该方法应用于何种神经网络。审查员认为卷积神经网络是深度神经网络的一种,在对比文件中公开的内容的基础上本领域技术人员容易想到将该方法应用于卷积神经网络中。当网络达到收敛条件时终止训练,这是本领域技术人员的惯用手段。从上述的审查员的意见中也可以看出,若发明中涉及机器学习算法的改进,改进的算法是可以用于评价创造性的,审查员并直接排除非技术特征的算法。从另一个角度来说,如果纯算法能够成为适格的专利客体,那么算法与技术特征结合作为整体,其中的算法的贡献自然能够用来评价创造性。
3.公开不充分与说明书支持:
略
中国目前并未颁布针对人工智能及机器学习的审查指南,我们只能从具体的个案来推测相关做法。
从中国、美国、欧洲、日本四个国家与地区涉及人工智能及机器学习的专利审查规定与实例的分析来看,在可专利性的客体方面,美国在修订指南之前最为严格,但2019年新修改的指南明显放宽了客体的范围,欧洲的规定比较严格,但实践中在训练方法与分类器上还有一些算法专利的授权。中国与日本均有纯算法专利的授权,日本专利局在客体上的规定最为宽松,在日本专利局公开的审查指南中,甚至都未列出纯算法的反例。目前有许多只涉及到机器学习算法的专利申请在日本获得授权,例如关于神经网络算法改进方面的专利申请。鉴于中国在人工智能领域相关专利申请的不断增长,审查指南有必要做出专门的规定。从实例分析来看,中国目前相关的专利申请数量排在世界前列,在客体上保持相对宽松的标准有利于企业的知识产权保护。在评价创造性方面,中美欧日都认同算法与技术结合时,若算法的改进对技术方案具有明显的效果,改进的算法可以用来评价创造性。
欧美日在人工智能及机器学习领域的专利审查已经出台修改的审查指南,但该领域专利非常特殊,在实践中,审查员的主观判断影响比较大,即使在欧洲也有一些纯算法的专利获得授权,对于“技术特征”与“利用自然规律”这些术语的理解很难做到完全客观,有些专利被驳回有可能仅是语言表达引起的误解。在人工智能领域,若进行专利的全球布局,企业需要更加注意各国在相关问题上不同态度,这就需要企业需要针对不同地区的法律对权利要求做大幅度修改。(感谢第四范式(北京)技术有限公司知识产权总监张云珠对本文提出的宝贵意见)
参考文献:
JPO:Case Examplespertinent to AI-related technology
国家知识产权局:《专利审查指南》,2017年修订版
EPO: Guidelines for Examination, Artificial intelligence and machine learning
SUPREME COURT OF THE UNITED STATES: ALICE CORPORATION PTY.LTD. v. CLS BANK INTERNATIONAL ET AL.
USPTO:Subject matter eligibility,https://www.uspto.gov/patent/laws-and-regulations/examination-policy/subject-matter-eligibility
历史文章: