上海高院:【全国首例软件发明专利侵权案】百度输入法没有侵害搜狗输入法软件发明专利权
一、一审原告搜狗公司诉讼请求
1.判令两百度公司立即停止侵害发明专利“一种用户词参与智能组词输入的方法及一种输入法系统”(专利号为ZL200810113984.9)专利权的行为,即判令:
(1)两百度公司立即停止制作侵害“一种用户词参与智能组词输入的方法及一种输入法系统”专利权的百度输入法;
(2)两百度公司立即停止在自己或者第三方经营的网站或者应用平台上发布侵害“一种用户词参与智能组词输入的方法及一种输入法系统”专利权的百度输入法供公众用户下载;
(3)两百度公司立即停止将侵害“一种用户词参与智能组词输入的方法及一种输入法系统”专利权的百度输入法提供给手机生产厂商让其预装在所生产销售的手机中。
2.判令天熙公司立即停止侵害“一种用户词参与智能组词输入的方法及一种输入法系统”(专利号ZL200810113984.9)发明专利权的行为,即停止许诺销售、销售预装有侵害“一种用户词参与智能组词输入的方法及一种输入法系统”专利权的百度输入法的手机。
3.判令两百度公司赔偿搜狗公司包括为制止侵权所支付的合理开支在内的经济损失人民币1,000万元,其中人民币5万元由天熙公司连带赔偿。
4.诉讼费用由三被告承担。
二、法院判决
一审法院(上海知产):驳回原告搜狗公司的全部诉讼请求。
二审法院(上海高院):驳回上诉,维持原判
三、裁判要旨
一审法院(上海知产):涉案专利的二元对需要参与计算概率,因此涉案专利二元对的技术特征不仅记录“相邻的两个词”,还记录“该两个词之间的相邻关系”。相比较被控侵权软件与涉案专利的二元对技术特征,二者相同之处在于均记录了相邻输入的词,二者的不同之处在于被控侵权软件未区分形成同一自造词的不同组合,即未记录相邻词的相邻关系。此外,根据涉案专利说明书、涉案专利无效宣告请求审查决定,可知“词频”与“概率”之间存在区别和联系。词频是用户输入某特定词的频次,涉案专利中的“概率”指用户输入某相邻词对在用户输入的所有相邻词对中出现的可能性,二者相同之处在于:均受用户输入该特定词次数的影响,但均不简单等于用户输入的次数;二者的不同之处在于:概率T(A,B)/(SUMBI)受用户输入二元词对的总次数(SUMBI)影响,而词频不受用户输入二元词对的总次数(SUMBI)影响。经过对被控侵权软件进行测试并勘验源程序,被控侵权软件根据用户输入自造词的总次数赋予用户自造词相应词频信息,未统计用户自造词占所有用户所有自造词的概率,涉案专利权利要求书及相关专利审查文档已明确区分“频次”和“概率”的不同含义,因此,在专利侵权判断中,应将二者直接认定为不同的技术特征,而不再考虑二者是否构成等同。据此,被控侵权软件与涉案发明专利权利要求1构成既不相同,也不等同的技术方案,没有落入涉案专利权利要求1的保护范围。
一审法院(上海高院):关于计算机软件发明专利侵权案件的举证责任分配,专利权人不仅要举证证明被控侵权软件的技术效果相同,而且要证明其存在较大的侵权可能性。在专利权人完成初步举证义务之后,被控侵权人负有证明二者技术手段不同的举证义务。
关于计算机软件发明专利侵权的比对,技术效果的相同不等同于整个技术方案的相同。一项技术方案由若干技术特征组成,在分析技术特征时,需从整体技术方案的角度分析,既要考虑记载在技术特征字面上的含义,还需要关注技术特征之间的内在联系。专利权利要求书及相关专利审查文档已明确区分的技术特征,不应再考虑是否构成等同。
一审合议庭:商建刚、王行恒、金波
二审合议庭:薛林、马剑峰、张莹
北京搜狗科技发展有限公司与北京百度网讯科技有限公司、百度在线网络技术(北京)有限公司侵害专利权纠纷二审民事判决书
上海高级人民法院
民事判决书
(2018)沪民终134号
上诉人(原审原告):北京搜狗科技发展有限公司
住所地:北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间。
法定代表人:洪涛,董事长。
委托诉讼代理人:王昭林,北京市君合律师事务所律师。
委托诉讼代理人:魏宇明,北京市君合律师事务所律师。
被上诉人(原审被告):百度在线网络技术(北京)有限公司。
住所地:北京市海淀区上地十街10号百度大厦三层。
法定代表人:崔珊珊,总经理。
委托诉讼代理人:瞿淼,北京市金杜律师事务所上海分所律师。
委托诉讼代理人:杜承彦,北京市金杜律师事务所上海分所律师。
被上诉人(原审被告):北京百度网讯科技有限公司。
住所地:北京市海淀区上地十街10号百度大厦2层。
法定代表人:梁志祥,副总裁。
委托诉讼代理人:李辉,北京市金杜律师事务所专利代理人。
委托诉讼代理人:陈颖,北京市金杜律师事务所律师。
原审被告:上海天熙贸易有限公司。
住所地:上海市松江区九亭镇龙金路281号2号楼第四层南部。
法定代表人:徐勇琴
上诉人北京搜狗科技发展有限公司(以下简称搜狗公司)因与被上诉人百度在线网络技术(北京)有限公司(以下简称百度在线公司)、北京百度网讯科技有限公司(以下简称百度网讯公司),原审被告上海天熙贸易有限公司(以下简称天熙公司)侵害发明专利权纠纷一案,不服上海知识产权法院(2015)沪知民初字第747号民事判决,向本院提起上诉。本院于2018年4月12日立案后,依法组成合议庭,公开开庭进行了审理。上诉人搜狗公司的委托诉讼代理人王昭林、魏宇明,被上诉人百度在线公司的委托诉讼代理人瞿淼、杜承彦,被上诉人百度网讯公司的委托诉讼代理人李辉、陈颖,搜狗公司聘请的专家辅助人崔欣、毕长生,百度在线公司聘请的专家辅助人孟可丰、李照坤到庭参加诉讼。天熙公司经本院依法传唤,未到庭参加诉讼。本案现已审理终结。
上诉人搜狗公司上诉请求:撤销一审判决,将本案发回重审或改判支持上诉人一审针对百度在线公司和百度网讯公司(以下简称两百度公司)的全部诉讼请求。
主要理由:1.原审判决认定事实错误。其一,涉案专利权利要求1中“一种建立用户多元库的方法”并非涉案专利的前序部分,其系涉案专利权利要求1的主题名称。百度输入法软件亦是一种建立用户多元库的方法,其具有相同的技术特征。其二,原审判决错误解释涉案专利权利要求1中的技术特征2,从而导致认定百度输入法不具有与技术特征2相同的技术特征。原审判决将技术特征2解释为不仅要求记录“相邻的两个词”,还记录“该两个词之间的相邻关系”,而记录“该两个词之间的相邻关系”,就是要记录两个词相邻出现的概率,从而将权利要求1中技术特征3、4的内容读入了技术特征2中,导致权利要求技术特征划分的重复与混乱。搜狗公司的实验C-2测试结果表明,百度输入法软件不只存储了整词,也存储了二元词对,并在组词过程中调用了二元词对。百度输入法软件将获取的相邻用户字词对拼接为一个整词存储、还是词对分别存储,或者相邻用户词放在一起既可以作为整词被调用、也可以作为词对被调用,均与技术特征2无关。其三,概率是可能性,在观察次数充分大的情况下,可以把频次作为概率。涉案专利说明书[0119]段载明“系统一元概率(相当于系统词频)”,[0162]段载明“用户词频(即用户一元概率)”“系统词频(即系统一元概率)”。因此,概率与频次虽然数学含义不同,但从词出现的可能性角度来说,“词频”和“概率”属于等同的技术特征,是本领域技术人员无需创造性劳动就可以联想到的。原审判决以存在与界定涉案专利权利要求1保护范围不相关的“隐式自造词”(整词)为由,认为百度输入法软件没有技术特征3、4是错误的。
2.一审法院举证责任分配不合理。被诉侵权的百度输入法软件如何执行后台计算机程序从而实现涉案专利所能实现的技术效果为终端用户所不可见,百度输入法软件由两百度公司设计开发,两百度公司是百度输入法软件后台处理过程的实际知情及相关证据的控制者。实验C-2测试结果表明,百度输入法软件不只存储了整词,也存储了二元词对,并在组词中调用了二元词对。故搜狗公司已经从百度输入法软件的操作现象和功能上证明了百度输入法软件实现了涉案专利所实现的技术效果,举证责任应当转移至两百度公司。而两百度公司没有提交证据证明百度输入法软件采用了不同于涉案专利保护的技术方案去实现专利所要实现的技术效果,应当承担不利法律后果。搜狗公司请求二审法院基于被诉侵权的百度输入法软件程序源代码,要求两百度公司举证证明百度输入法软件采用了不同于涉案专利保护的技术方案,从而实现实验C-2测试结果表明的“存储了二元词对,并在组词中调用了二元词对”的技术效果。
3.一审法院审理过程中限制搜狗公司获取两百度公司提供的证据甚至两百度公司提供的反驳主张,严重损害了搜狗公司对证据的质证权利和针对性地对两百度公司主张进行反驳的权利。一审中,两百度公司以涉及技术秘密为由,要求不公开审理。一审法院不经审查两百度公司关于技术秘密的主张是否成立,径直按照两百度公司要求,在诉讼过程中,仅限搜狗公司代理人当庭阅看两百度公司提供的证据、反驳实验及具体反驳理由,不允许搜狗公司员工以及技术人员阅读《百度输入法用户库实现方式及抗辩理由说明》等,以致搜狗公司难以完全理解两百度公司提供的证据、反证实验及具体反驳理由。在对百度输入法软件程序源代码进行勘验时,只允许搜狗公司委托的律师事务所员工以委托诉讼代理人或者专家辅助人身份在短时间内观看被上诉人的演示,不允许搜狗公司员工(以专家辅助人身份)观看演示,严重损害了搜狗公司对证据的质证权利和针对性地对两百度公司主张进行反驳的权利。此外,一审法院仅按照两百度公司事前提供的《关于现场勘验方案的说明》进行片面勘验,为证明百度输入法软件能够将所获相邻用户字词对拼接为一个整词而进行勘验,没有进一步勘验百度输入法软件程序源代码,限制了搜狗公司获知两百度公司提供证据的权利。
两百度公司辩称:1.一审法院认定事实清楚。其一,根据《专利法实施细则》第21条规定,一审法院将“一种建立用户多元库的方法”认定为前序部分正确。百度输入法软件存储的是整词,不存储有相邻关系的用户字词对,不存在用户多元库,其是一种建立用户词库的方法,一审法院关于二者属于相同技术领域而非相同技术特征的认定无误。其二,涉案专利权利要求1中“具有相邻关系的用户字词对”是指有多元关系或多元信息的字或词的组合,具体来说应当包含两层含义:一是字或词的组合;二是字或词之间的“相邻关系”,即谁和谁相邻本领域技术人员在计算“概率”时亦必须明确是谁和谁之间的二元关系。以“外面-正在”为例,涉案专利计算的是“外面-正在”在所有用户二元对中的概率,而不是“外一面正在”的概率。百度输入法软件采用的是“隐式自造词”的技术方案,即当用户进行连续两次直接上屏输入时,将用户本次输入的上屏词和用户输入的上一个上屏词拼接成一个词,作为用户自造词存入用户词库。百度输入法软件采用整词的存储方式,没有获取相邻关系的用户字词对。搜狗公司C-2实验不能证明百度输入法软件用户词库中存在用户字词对。其三,涉案专利所述的概率指的是用户二元库中存储用户字词对在用户输入时相邻出现的概率,并且该概率的计算方式是T(A,B)/SUMBI,而不是泛指所有概率。百度输入法软件仅统计了用户词被输入的次数,没有统计用户词出现的概率。“词频”与“概率”属于既不相同也不等同的技术手段,百度输入法软件并未落入涉案专利权保护范围。
2.关于举证责任分配。两百度公司针对搜狗公司的每一个实验均有反驳和实验,也提供了验证实验和源代码以证实百度输入法软件没有落入涉案专利权保护范围,两百度公司已经尽已所能举出了所有证据,搜狗公司提出的该项上诉理由不能成立。
3.一审法院并未损害搜狗公司质证权利。两百度公司相关抗辩意见及说明属于当事人的意见陈述,相关说明中包含百度输入法软件的设计理念及实现方式,一审法院已给予搜狗公司足够的时间和机会对相关材料进行阅看,对相关证据进行质证。源代码勘验系在法官、技术调查官、鉴定专家及搜狗公司、两百度公司均在场的情况下进行的。百度输入法软件源代码涉及两百度公司的核心商业秘密,一审法院认为不应直接披露给搜狗公司,但一审法院给予搜狗公司足够的时间对百度输入法软件的实现方式进行阅看和研究,搜狗公司完全有机会和时间对百度输入法软件源代码勘验发表质证意见。因此,其相关质证权利受到损害的主张不能成立。
天熙公司未向本院提交答辩意见。
上诉人搜狗公司向一审法院起诉请求:1.判令两百度公司立即停止侵害发明专利“一种用户词参与智能组词输入的方法及一种输入法系统”(专利号为ZL200810113984.9)专利权的行为,即判令:(1)两百度公司立即停止制作侵害“一种用户词参与智能组词输入的方法及一种输入法系统”专利权的百度输入法;(2)两百度公司立即停止在自己或者第三方经营的网站或者应用平台上发布侵害“一种用户词参与智能组词输入的方法及一种输入法系统”专利权的百度输入法供公众用户下载;(3)两百度公司立即停止将侵害“一种用户词参与智能组词输入的方法及一种输入法系统”专利权的百度输入法提供给手机生产厂商让其预装在所生产销售的手机中。2.判令天熙公司立即停止侵害“一种用户词参与智能组词输入的方法及一种输入法系统”(专利号ZL200810113984.9)发明专利权的行为,即停止许诺销售、销售预装有侵害“一种用户词参与智能组词输入的方法及一种输入法系统”专利权的百度输入法的手机。3.判令两百度公司赔偿搜狗公司包括为制止侵权所支付的合理开支在内的经济损失人民币1,000万元(以下币种相同),其中人民币5万元由天熙公司连带赔偿。4.诉讼费用由三被告承担。
事实与理由:搜狗公司拥有名称为“一种用户词参与智能组词输入的方法及一种输入法系统”的发明专利,专利号为ZL200810113984.9,该专利至今有效。两百度公司未经搜狗公司许可,为生产经营目的实施了搜狗公司享有的涉案专利的技术方案,落入了搜狗公司涉案专利权利要求1、2、3、4、5、6、7、8、16、17、18、19、20、21、22、23的保护范围。两百度公司共同制作了百度输入法,百度在线公司在百度软件中心(http://rj.baidu.com)、百度输入法官网(http://shurufa.baidu.com)百度手机输入法官网(http://srf.baidu.com),appstore,android各类Android应用市场、各类软件下载网站(如“hao123下载”“太平洋电脑网下载中心”“天空软件站”“华军软件园”“非凡软件站”等)发布和对外提供Android版百度输入法、iOS版百度输入法和PC版百度输入法等,供公众下载,用户注册协议显示该协议由百度网讯公司与注册用户签订。此外,两百度公司将百度输入法提供给手机厂商让其预装在所生产的手机中。天熙公司许诺销售、销售预装有百度输入法的“OnePlus2”手机。搜狗公司认为,“OnePlus2”手机预装的Android版百度输入法系统包含了建立用户二元库的方法,百度输入法软件能够在用户输入的过程中记录用户对句子的输入和对上屏词的选择操作。例如,针对用户“明天”“会加”的相邻输入和上屏操作进行记录。百度输入法系统能够根据用户对“明天”“会加”的相邻分别输入的上屏方式而获取“明天-会加”词对。首次输入“mingtianhuijiaqule”的候选项为“明天回家去了”,在分别输入上屏“明天”“会加”4次后,再次输入“mingtianhuijiaqule”,首个候选项变为“明天会加去了”,由此判断百度输入法系统也记录了用户输入“明天-会加”的总次数和概率,并建立了二元库。三被告应当承担停止侵权、赔偿损失的法律责任。在一审审理过程中,搜狗公司明确其指控对象为百度输入法中“隐式自造词”的技术方案。
一审法院经审理查明:
一、关于涉案专利的有关事实
涉案专利为“一种用户词参与智能组词输入的方法及一种输入法系统”,专利号为ZL20810113984.9,搜狗公司为专利权利人,该专利至今维持有效。涉案专利共包括28项权利要求,其中权利要求1、2、3、4、5、6、7、8、16、17、18、19、20、21、22、23的具体内容分别为:
1.一种建立用户多元库的方法,其特征在于,包括:
在用户输入过程中,记录所述用户对句子的输入和对上屏词的选择操作,根据所述用户输入的上屏方式获取具有相邻关系的用户字词对,所述用户字词对包括至少两个相邻的用户字词;
记录所述用户字词对在所述用户输入时出现的总次数,统计所述用户字词对在所述用户输入时相邻出现的概率;
建立用户多元库,将所述用户字词对及其相邻出现的概率保存到所述用户多元库。
2.根据权利要求1所述的方法,其特征在于,通过以下方式获取具有相邻关系的用户字词对:
在用户的一次上屏操作中,根据用户选择候选上屏词的方式获取相邻的候选上屏词作为用户字词对。
3.根据权利要求1所述的方法,其特征在于,还包括对用户多元库的更新步骤,具体包括:
在用户输入的上屏结果中,如果相邻候选上屏词组成的用户字词对在用户多元库中存在,则增强用户多元库中该用户字词对相邻出现的概率;
否则,将所述相邻候选上屏词作为新的用户字词对添加到用户多元库中,并增强该用户字词对相邻出现的概率。
4.根据权利要求1所述的方法,其特征在于,还包括对用户多元库的削弱步骤,具体包括:
根据用户对上屏结果的修改,针对上屏结果中修改前的上屏词对应的用户字词对,削弱其相邻出现的概率;
和/或,针对用户多元库中长期得不到命中的用户字词对,根据该用户字词对的最后命中时间进行削弱。
5.根据权利要求1所述的方法,其特征在于,还包括:
根据用户输入的标点符号进行句子划分;
在同一个句子或子句中,根据用户的上屏操作,将相邻的上屏结果也作为用户字词对保存到所述用户多元库;
并统计所述用户字词对相邻出现的概率,保存到所述用户多元库。
6.根据权利要求1、2、3、4、5任意一项所述的方法,其特征在于:所述用户多元库建立在客户端。
7.一种利用权利要求1所述的用户多元库进行智能组词输入的方法,其特征在于,包括:
接收用户输入的编码字符串,并对所述编码字符串进行切分;
在用户词库和系统词库中查找与切分后的编码字符串相匹配的字词,并利用用户多元库和系统多元库进行组词;
计算每种组词结果的概率,并将概率值符合预置条件的组词结果作为候选项输出。
8.根据权利要求7所述的方法,其特征在于,通过以下方式计算每种组词结果的概率:
根据用户词频、用户字词相邻出现的概率以及系统词频、系统字词相邻出现的概率,计算每种组词结果的概率。
16.一种建立用户多元库的装置,其特征在于,包括:
第一获取单元,用于在用户输入过程中,记录所述用户对句子的输入和对上屏词的选择操作,根据所述用户输入的上屏方式获取具有相邻关系的用户字词对,所述用户字词对包括至少两个相邻的用户字词;
统计单元,用于记录所述用户字词对在所述用户输入时出现的总次数,统计所述用户字词对在所述用户输入时相邻出现的概率;
建立单元,用于建立用户多元库,将所述用户字词对及其相邻出现的概率保存到所述用户多元库。
17.根据权利要求16所述的装置,其特征在于,所述第一获取单元通过以下方式获取具有相邻关系的用户字词对:
在用户的一次上屏操作中,根据用户选择候选上屏词的方式,获取相邻的候选上屏词为用户字词对。
18.根据权利要求16所述的装置,其特征在于,还包括:
更新单元,用于对所述用户多元库进行更新,更新方式为:
在用户输入的上屏结果中,如果相邻候选上屏词组成的用户字词对在用户多元库中存在,则增强用户多元库中该用户字词对相邻出现的概率;否则,将所述相邻候选上屏词作为新的用户字词对添加到用户多元库中,并增强该用户字词对相邻出现的概率。
19.根据权利要求16所述的装置,其特征在于,还包括:
削弱单元,用于对所述用户多元库进行削弱,削弱方式为:
根据用户对上屏结果的修改,针对上屏结果中修改前的上屏词对应的用户字词对,削弱其相邻出现的概率;和/或,针对用户多元库中长期得不到命中的用户字词对,根据该用户字词对的最后命中时间进行削弱。
20.根据权利要求16所述的装置,其特征在于,还包括:
第二获取单元,用于根据用户输入的标点符号进行句子划分在同一个句子或子句中,根据用户的上屏操作,将相邻的上屏结果也作为用户字词对保存到所述用户多元库;
相应的,所述统计单元统计所述用户字词对相邻出现的概率,并保存到所述用户多元库。
21.根据权利要求16所述的装置,其特征在于:
所述用户多元库建立在客户端,所述装置为客户端装置。
22.一种输入法系统,其特征在于,包括:
用户多元库,用于保存具有相邻关系的用户字词对,所述用户字词对包括至少两个相邻的用户字词;
切分单元,用于接收用户输入的编码字符串,并对所述编码字符串进行切分;
组词单元,用于在用户词库和系统词库中查找与切分后的编码字符串相匹配的字词,并利用用户多元库和系统多元库进行组词;
计算单元,用于计算每种组词结果的概率;
输出单元,用于将概率符合预置条件的组词结果作为候选项输出。
23.根据权利要求22所述的系统,其特征在于,所述计算单元通过以下方式计算每种组词结果的概率:
根据用户词频、用户字词相邻出现的概率以及系统词频、系统字词相邻出现的概率,计算每种组词结果的概率。
涉案专利说明书[0007]段、[0058]段、[0069]段、[0096]段、[0116]段到[0120]段记载了涉案专利的技术背景、二元库、二元对、概率的相关内容。
搜狗公司2016年1月27日《关于4W104282号无效宣告案件的意见陈述书》,以及国家知识产权局专利复审委员会2016年10月24日《无效宣告请求审查决定书》(第30349号)第15页、第22页、第24页对涉案专利的相关技术特征进行了分析。
二、关于搜狗公司指控三被告实施侵权行为的相关事实
2015年11月9日,上海市卢湾公证处公证员随同搜狗公司代理人前往位于上海市漕溪北路339号百脑汇二期2F14B店铺。搜狗公司代理人购买了一部“OnePlus2”手机(型号为ONEA2001,IME为867271029684718),现场取得发票号码为00154150的发票一张,开票日期为2015年11月9日,发票金额为2,750元,发票开具单位显示为天熙公司。上海市卢湾公证处就上述购买过程出具了编号为(2015)沪卢证经字第4579号公证书。天熙公司提供编号为00154150的发票存根,显示开票日期为2015年5月12日,金额为70元,发票项目为办公用品。经比对搜狗公司通过公证取得发票与天熙公司提供的发票存根,二者的发票号码、发票代码、税务登记号相同,但开票日期、开票科目、发票金额、税控码、发票专用章印鉴式样均不同。2016年3月16日,上海市闵行区国家税务局、上海市地方税务局闵行区分局出具鉴定证明认为,搜狗公司经过公证保全程序取得的发票系伪造,天熙公司提供的发票存根为真票。天熙公司否认销售了被控侵权的手机。一审法院赴上海市闵行区国家与地方税务局调查,该局工作人员向一审法院确认,搜狗公司购买涉案手机所取得的发票系伪造。经勘验,搜狗公司公证保全的“OnePlus2”手机,型号为ON2001,IME为867271029684718,操作系统为Android版本5.1.1,其中已安装v5.2.10.67版本百度输入法软件。一审庭审中,搜狗公司当庭将安卓版百度输入法v5.8.2.0装入“0nePlus2”手机,并以此为版本进行相关试验操作。搜狗公司与两百度公司确认,v5.2.10.67版本与v5.8.2.0版本的实现原理、实现方式一致,对任何一版本指控的结果适用于在此之前所有对外发布的各种版本的百度输入法软件,包括手机版、电脑版。两百度公司承认在被控侵权的“OnePlus2”手机上预装了被控侵权的百度输入法软件。
三、关于被控侵权的百度输入法软件进行的相关测试
本案搜狗公司、两百度公司、鉴定人均对百度输入法进行了测试,对测试结果的真实性各方均予以确认。测试方法为:
1.将被控侵权的百度输入法软件恢复至初始状态,调取目标程序文件/data/data/com.baidu.input/files目录下的文件名-14-为Uz2.bin的初始数据;
2.在全拼输入法模式下输入文字、词,记录对上屏词的选择以及上屏方式,并调取每个测试步骤中的U2.bin,找出与初始文件Uz2.bin的区别代码;
3.修改U2.bin中标记词频的代码,重新写入百度输入法目标程序中,观察输入相同拼音后出现候选上屏词的顺序变化情况。
(一)为了证明百度输入法存储了用户二元对,搜狗公司对百度输入法进行了如下测试:
以“woyaohuijia”的1+3的模式为例,具体如下:
输入“握”上屏,输入“药毁假”上屏(连续两次)后,百度输入法的Uz2.bin中针对该输入操作会存储如下三条信息:
0000000c001000060ea0000CE500000
46190104C003000060EA0000285B1515E91F0000
B6290104000401000000C50285B1515E91F
其中,第一条是记录“握”的信息,“CE50”为“握”的编码,该条信息中“60EA”记录“握”出现的频次;第二条是记录“药毁假”的信息,其中“285B1515E91F”为“药毁假”的编码,“60EA”记录“药毁假”出现的频次;第三条记录“握药毁假”的信息,其中“CE50285B1515E91F”为“握药毁假”的编码,0000”记录“握药毁假”出现的频次。搜狗公司认为,首先,用户在输入过程中是分别上屏“握”和“药毁假”的,这样的输入方式获得的只能是两个用户词以及这两个用户词相互之间的关系;其次,如果“握药毁假”作为一个整词存储,则不应存储用户词“握”和用户词“药毁假”的信息。因此,在使用百度输入法输入的过程中,根据用户输入的上屏方式(即先“握”上屏,再“药毁假上屏)获取了具有相邻关系的用户字词对(“握药毁假”),且所述用户字词对包括至少两个相邻的用户字词。
(二)为了证明百度输入法统计了用户二元对的概率,搜狗公司对百度输入法进行了如下测试:
第一步:在百度输入法初始状态下,分别输入“tianminghuijia,第一候选词分别是“天明”“回家”;
第二步:连续两次直接上屏“天明”“会加”,分别获得“天明”“会加”“天明会加”在Uz2.bin中的相应代码:
第一次获得的代码:
2f160103C0020000D8D600003A41A42D
E733010400040000000003A41A42DD114ECIF
93140103C0020000D8D6000OD114ECIF
第二次获得的代码:
2F160103C00200006EA00003A41A42D
E733010480040200D8D600003A41A42DD114ECF
93140103c0000060ED14CF
第三步:连续3次分别上屏输入“天命”“汇佳”,分别获得“天命”“汇佳”“天命汇佳”在U2.bin中的相应代码:
第一次获得的代码:
330103c00000D8D600003A419F2D
F4330104000403000000003A419F2D1715E8F
F0330103c00200008600001715E8F
第二次获得的代码:
eb330103C002000060EA00003A419F2D
F433010480040400D8D600003A419F2D1715E81F
F0330103C002000060EA00001715E8IF
第三次获得的代码:
EB330103C02000061EA00003A419F2D
F4330104800405006EA00003A49F2D1715E81F
fo330103c000006a00001715e8
第四步:当再次输入“tianminghuijia时,首选词变成了天命汇佳”,并且对应的编码是3A419F2D1715E81F(即“天命汇佳”的十六进制编码)。
(三)为了证明百度输入法用户词库中存储的是词对,而非整词,搜狗公司对百度输入法还进行了如下测试:
第1-5步对百度输入法进行如下训练:
建立用户词对“天命-会加”,简称“ab-cd”;
建立用户词对“会加-大排”,简称“cd-ef”;
输入干扰用户词“天明”,简称“a’b’”
输入干扰用户词“打牌”,简称“e’f”。
通过第5步使得干扰用户词“天明”上屏3次,“天命”上屏2次,从而“天明”(即a’b’)的词频大于“天命”(即ab),并且干扰用户词“打牌”上屏3次,而“大排”上屏2次,从而“打牌”(即e’f’)的词频大于“大排”(即ef)。
经过上述5步骤之后进行3项输入,观察候选上屏词的情况。1.输入“tianminghuijiadapai”之后的第一个候选是“天命会加18-大排”(即abcdef)。据此,搜狗公司认为,百度输入法采用了ab+cd和cd+ef组词方式,针对“天命-会加”以及“会加-大排”是以词对的方式存储的;百度输入法没有采用abcd+e’f’的组候选;百度输入法也没有采用a’b’+cdef的组词方式,否则应该出现“天明会加大排”(即a’b’cdef)这个候选。由此可见,如果按整词来存储,那么当输入“tianminghuijiadapai”之后其出现的候选项应为“天命会加-打牌”(即abcd+e’f’)或者“天明-会加大排”(即a’b’+cdef)。2.输入“tianming”候选上屏词的第一项为“天明”,第二项为“天命”。3.输入“dapai”候选上屏词的第一项“打牌”,第二项为“大排”。
(四)为了证明百度输入法没有存储用户二元对,两百度公司对百度输入法进行了如下测试:
第一种测试方法:在百度输入法初始状态下,输入4次“握”“药毁假”,获取每一次输入“握”“药毁假”后在Uz2.bin中的相应代码,第4次输入后与原始词库相比较,新增如下三段代码:
00000000620000C500000
000046190104C00362EA0000285B1515E91F0000
B62901048004030060EA00CE50285B1515E9F
第二种测试方法:在百度输入法初始状态下,输入4次“握“毁假”,获取每一次“握药”“毁假”后在Uz2.bin中的相应代码,第4次输入后与原始词库相比较,新增如下三段代码:
B6290103C002000062EA00OCE50285B
93140103c2000062e00001515e9F
EC3301048004030060EA0000
第三种测试方法:百度输入法初始状态下,输入4次“握药毁”“假”,获取每一次输入“握药毁”“假”后在Uz2.bin中的相应代码,第4次输入后与原始词库相比较,新增如下三段代码:
B6290104C00300006EA00OOCE505285B15150000
0000000000ea000091F0000
c33010800403006A00OCE50285B1515E91F
第四种测试方法:清空用户词库,一次性上屏“握药毁假”,获取“握药毁假”在Uz2.bin中的相应代码:
b6290104c0400000000e50285b1515e9F
(五)搜狗公司对百度输入法进行了如下训练和测试在百度输入法初始状态下,采用“woyaohuijia”的拼音输入“握药毁假”,按照1+3、2+2、3+1的三种不同上屏方式分别操作5次,获取Uz2.bin的相应目标代码信息如下:
(1+3)B6290104C004030061EA00000CE550285B1515E91F
(2+2)E7330104C004030061EA0OOCE50285B1515E91F
(3+1)E7330104C004030061EA0OCE50285B1515E91F
各方确认,“握药毁假”对应的十六进制编码为CE50285B1515E91F。无论“握药毁假”采取哪种组合方式,其十六进制编码均相同。
(六)鉴定人独立进行了试验,试验手机:“0nePlus2”手机,百度输入法版本为Android百度输入法一加专版v5.2.10.67,获得结果:
“高速沃玛”对应的十六进制编码为F10FB740D350592F。搜狗公司与两百度公司确认,Uz2.bin中D8D6为“高速沃玛”的频次,该数据经修改后,百度输入法仍能正常使用,并观察到该数值大小正向影响到“高速沃玛”出现在候选上屏词中的前后位置。
经勘验被控侵权的百度输入法源程序(对应目标程序版本号为v5.8.2.0),各方确认了百度输入法隐式自造词技术方案中的源程序和算法,并确认了在对目标程序测试过程中获取的相关代码(例如,B6290104800403000EA0000CE550285B1515E91F)的含义,源程序算法与目标代码之间能相互对应。
本案一审司法鉴定费用为15万元,鉴定人两次出庭费用合计为49,044元,均由搜狗公司预付。
一审法院认为,搜狗公司是涉案ZL200810113984.9号“一种用户词参与智能组词输入的方法及一种输入法系统”发明专利的专利权人,该专利目前处于有效状态。根据《中华人民共和国专利法》(以下简称专利法)第十一条第一款规定:“发明和实用新型专利权被授予后,除本法另有规定外,任何单位或者个人未经专利权人许可,都不得实施其专利,即不得为生产经营目的制造、使用、许诺销售、销售、进口其专利产品,或者使用其专利方法以及使用、许诺销售、销售、进口依照该专利方法直接获得的产品。”搜狗公司指控两百度公司开发并向社会公众提供的被控侵权的百度输入法落入涉案专利权利要求1、2、3、4、5、6、7、8、16、17、18、19、20、21、22、23的保护范围涉案专利权利要求1为方法独立权利要求,权利要求2、3、4、5、6为权利要求1的从属权利要求。权利要求7的主题名称为“一种利用权利要求1所述的用户多元库进行智能组词输入的方法”,包括权利要求1的全部技术特征。权利要求7为独立权利要求,权利要求8为权利要求7的从属权利要求。权利要求16的技术特征与权利要求1的技术特征一一对应,是以虚拟装置形式撰写的权利要求,二者的技术手段、功能、效果均相同。权利要求17、18、19、20、21为权利要求16的从属权利要求,且与权利要求2、3、4、5、6的技术特征逐一对应。权利要求22的技术特征与权利要求7的技术特征一一对应,是以虚拟装置形式撰写的权利要求。权利要求23为权利要求22的从属权利要求。因此,搜狗公司主张的其他权利要求均包括涉案专利权利要求1的技术特征,被控侵权的百度输入法软件与涉案专利权利要求1的技术事实比对,是本案发明专利权侵权纠纷审理的基础。
《最高人民法院关于审理侵犯专利权纠纷案件应用法律若干问题的解释》第七条规定:“人民法院判定被诉侵权技术方案是否落入专利权的保护范围,应当审查权利人主张的权利要求所记载的全部技术特征。被诉侵权技术方案包含与权利要求记载的全部技术特征相同或者等同的技术特征的,人民法院应当认定其落入专利权的保护范围;被诉侵权技术方案的技术特征与权利要求记载的全部技术特征相比,缺少权利要求记载的一个以上的技术特征,或者有一个以上技术特征不相同也不等同的,人民法院应当认定其没有落入专利权的保护范围。”本案中,涉案专利权利要求1可分解为前序部分“一种建立用户多元库的方法”和如下4个技术特征:1.在用户输入过程中,记录所述用户对句子的输入和对上屏词的选择操作;2.根据所述用户输入的上屏方式获取具有相邻关系的用户字词对,所述用户字词对包括至少两个相邻的用户字词;3.记录所述用户字词对在所述用户输入时出现的总次数,统计所述用户字词对在所述用户输入时相邻出现的概率;4.建立用户多元库,将所述用户字词对及其相邻出现的概率保存到所述用户多元库。
关于前序部分“一种建立用户多元库的方法”的比对涉案发明专利的技术领域是输入法技术领域,特别是涉及种用户词参与智能组词输入的方法及一种输入法系统。被控侵权的百度输入法软件中隐式自造词的技术方案与涉案专利属于同一技术领域。
涉案发明所要解决的技术问题是提供一种用户词参与智能组词输入的方法及一种输入法系统,以解决现有的输入法系统灵活性较差,首选项的命中率不高,没有达到最佳用户体验的问题。被控侵权的百度输入法中隐式自造词的技术方案与涉案专利所要解决的技术问题相同。
涉案专利用户多元库是与系统词库相对应的,用于存储用户输入的自造词和频率。被控侵权的百度输入法软件在初始状态提供给用户使用后,将记录用户的输入方式和词频并建立用户自造词,二者均与系统词库相对应,均为存储用户自造词以及相关信息的数据库。
因此,二者的技术领域相同、所要解决的技术问题相同,可以进行技术特征侵权比对。
二、关于特征1“在用户输入过程中,记录所述用户对句子的输入和对上屏词的选择操作”的比对
“句子”的含义根据涉案专利权利要求5记载“根据用户输入的标点符号进行句子划分”确定。搜狗公司与两百度公司确认被控侵权的百度输入法软件记录了用户对上屏词的选择操作,也记录对句子的输入。
三、关于特征2“根据所述用户输入的上屏方式获取具有相邻关系的用户字词对,所述用户字词对包括至少两个相邻的用户字词”的比对
根据涉案专利具体实施方式[0069]段记载“所述用户二元信息与系统二元信息类似,是指在用户在输入过程中具有相邻关系的用户字词对”。[0058]段记载“所述用户二元库通过记录用户对句子的输入和对上屏词的选择,记录或更新同一句子中两个相邻输入的用户词之间的用户二元关系”。涉案专利说明书[0096]段记载“‘二元对A-B’的二元概率为T(A,B)/SUMBI,其中T(A,B)为A-B二元对在用户输入时出现的总次数,SUMBI为所有用户二元对的总次数,即所有T(,)的总和。增强A-B的二元概率就是T(A,B)=T(A,B)+1,增强后的A-B二元概率即为T’(A,B)/(SUMBI+1)”。一审法院认为,一项技术方案由若干技术特征组成,在分析技术特征时,需从整体技术方案的角度分析,既要考虑记载在技术特征字面上的含义,还需要关注技术特征之间的内在联系。涉案专利的二元对需要参与计算概率,因此涉案专利二元对的技术特征不仅记录“相邻的两个词”,还记录“该两个词之间的相邻关系”。以二次上屏操作“握药”“毁假”为例,涉案专利应记录“握药”与“毁假”为一对以及“握药-毁假”同时出现的概率,即表述为“握药-毁假”的二元对以及T(握药,毁假)/SUMBI。这样一来,就四字自造词“握药毁假”而言,将会出现“握-药毁假”“握药-毁假”“握药毁-假”的三种二元对,且记录三种二元对出现的概率。经过对被控侵权的百度输入法软件测试,且勘验源程序发现,百度输入法软件按照同一种算法,记录了用户对上屏词的选择以及用户的一次直接上屏词,储存了“握药”“毁假”以及“握药毁假”三个词的信息,根据输入字的时间先后顺序排列储存在计算机中,当“握药”为一个词的时候,“药”排在“握”的位置后面;当“毁假”为一个词的时候,“假”排在“毁”的位置后面;当“握药”和“毁假”组成一个自造词时,计算机程序将“毁假”的位置信息排在“握药”的位置信息之后,据此,当“握药毁假”为一个词的时候,“握”“药”“毁”“假”的位置顺序依次排列,并不含有“握药”与“毁假”为一对的信息。若以“握”和“药毁假”组成“握药毁假”,或者以“握药毁”和“假”组成“握药毁假,用户词库中记录“握药毁假”的编码是相同的,未区分“握-毁假”“握药-毁假”“握药毁-假”的不同组合。相比较被控侵权的百度输入法软件与涉案专利的二元对技术特征,二者相同之处在于:均记录了相邻输入的词;二者的不同之处在于:被控侵权的百度输入法未区分形成同一自造词的不同组合,即未记录相邻词的相邻关系。搜狗公司对百度输入法进行了测试,在采取1+3、2+2、3+1的三种不同上屏方式分别操作5次输入自造词“握药毁假”的三种情况下,获得“握药毁假”的十六进制代码是相同的,均为CE50285B1515E91F,可佐证隐式自造词的技术方案中不含有记录相邻关系信息的技术特征。
搜狗公司认为,百度输入法存储了两个相邻的用户字词,即存储了二元词对关系,百度输入法可以采取归一法处理“握-药毁假”“握药-毁假”“握药毁-假”的三种组合成为一种组合,一起参与计算概率。一审法院认为,无论是否采取归一化处理的后续措施,统计二元对出现的概率是以记录二元对为前提的。搜狗公司认为只要系统记录了前后两次输入的词,即记录了二元关系,一审法院对此难以认同。
两百度公司认为,词对和整词的实质区别点在于,当系统存储的是词对(例如2-2关系“握药-毁假”)时,在组词过程中,系统只能根据“握药”向用户提示候选词“毁假”。但是,当系统存储整词时,系统在组词过程中可以根据用户输入“握”“握药”或者“握药毁”分别向用户提示整词的其余部分作为候选项,即“药毁假”“毁假”或者“假”。可见,存储词对和整词会造成系统在组词时产生不同的候选词,进而产生了两种截然不同的技术效果。一审法院认为,输入法的“联想”功能与涉案专利所要解决的技术问题不同,且两百度公司未能清晰阐述涉案专利与输入法实现联想功能的技术方案存在何种关联关系,因此对其主张,一审法院亦不予采纳。
综上,被控侵权的百度输入法记录连续两次直接上屏词而拼接的词与涉案专利的“二元对”系不同的技术特征。鉴定意见认为,两者均根据用户输入的上屏方式来获取用户输入的至少两个具有相邻关系的上屏词的组合,两者虽然文字表述方式不同,但其技术内容相同,一审法院不予采纳。
四、关于特征3“记录所述用户字词对在所述用户输入时出现的总次数,统计所述用户字词对在所述用户输入时相邻出现的概率”的比对
(一)关于“词频”与“用户字词对相邻出现的概率”的异同
搜狗公司认为,“用户词频”表示词条的频率,也就是用户输入该词条的可能性大小,而概率也是表示一种可能性,因此“用户词频”与“概率”是同一种概念、没有实质区别。两百度公司认为,说明书中的“用户词频”与权利要求1中的“概率”是两个不同的概念,具有不同的含义。在本领域的公知常识中,频率是指某一周期内的次数,结合说明书的界定,“用户词频”是指客户端在一定周期内对词条赋予的一个与用户词相关的次数。权利要求1中与用户词相关的两个参数为“总次数”和“概率”,概率是指针对用户输入情况下,以用户的所有相邻情况为统计基数(分母),以用户输入过当前多元对的次数为分子,所计算得到的概率。
一审法院认为,第一,解释权利要求,可以使用涉案专利的说明书。涉案专利说明书[0007]段记载了“词频”的概念,“对于用户词库中的词条,客户端会根据用户输入这个词条的频率和最后一次输入这个词条的时间来对词条赋予一个频率,称为用户词频”。第二,解释权利要求,可以使用涉案专利权利要求书的相关权利要求所记载的内容。涉案专利权利要求8记载,“根据权利要求7所述的方法,其特征在于,通过以下方式计算每种组词结果的概率:根据用户词频、用户字词相邻出现的概率以及系统词频、系统字词相邻出现的概率,计算每种组词结果的概率”。涉案专利说明书第[0116]段到[0120]段记载“通过词频和二元概率的累计相乘,得到整条路径的概率”。第三,解释权利要求,可以使用涉案专利的审查文档。2016年1月27日,搜狗公司在《关于4W104282号无效宣告案件的意见陈述书》中认为,“权利要求1中的修改内容‘记录所述用户字词对在所述用户输入时出现的总次数’完全可以从原始公开内容直接地、无异议地确定出来。例如,根据本专利公开文本说明书第10页倒数第2、3段可知,对于已有二元对A-B’来说,其二元概率可以为T(A,B)/SUMBI,其中T(A,B)为A-B二元对在用户输入时的总次数,SUMBI为用户二元对的总次数”。2016年10月24日,国家知识产权局专利复审委员会在涉案专利《无效宣告请求审查决定书》(第30349号)第15页记载,“本领域技术人员能够明确,用户词频的调整与对应的用户字词对相邻出现的概率的调整是相应的,本领域技术人员能够根据具体的需求设计调整方式,例如,用户词频调高,对应的用户词对相邻出现的概率也调高处理,因此上述特征能够得到说明书支持”。该决定第22页记载,“权利要求1中的用户字词对相邻出现的概率也可称为多元概率是指多元信息的使用概率。基于本专利的整体发明构思来看,权利要求1中的用户字词对相邻出现的概率是以用户各次的历史输入作为统计范畴的,统计的是在用户输入过程中目标多元组作为一个整体出现的概率,其数学含义是,针对用户输入情况下,以用户输入的所有相邻情况为统计基数(分母),以用户输入过当前多元对的次数为分子所计算得到的概率。也就是说,权利要求1中的概率是指一个多元组作为一个整体出现的概率,它是基于统计得出的,是对整体性的估算”。该决定第24页记载,“在权利要求1的用户多元库中为用户字词对保存的概率则是用户输入时相邻出现的概率,即用户字词对在用户输入时相邻出现的可能性,也就是说,这个概率是相对于用户所有可能输入的相邻字词对而言的,其表示的是该用户字词对在用户所有可能输入的相邻字词对中出现的可能性”。综上,“词频”与“概率”之间存在区别和联系,词频是用户输入某特定词的频次,涉案专利中的“概率”指用户输入某相邻词对在用户输入的所有相邻词对中出现的可能性,二者相同之处在于:均受用户输入该特定词次数的影响,但均不简单等于用户输入的次数,“用户词频的调整与对应的用户字词对相邻出现的概率的调整是相应的”,词频和概率的大小均影响到系统返回候选词的先后顺序。二者的不同之处在于:概率T(A,B)/SUMBI受用户输入二元词对的总次数SUMBI影响,而词频不受用户输入二元词对的总次数SUMBI影响,因此二者的技术方案以及实施该方案的计算机程序算法是不同的。
(二)被控侵权的百度输入法软件未统计二元对出现的概率
经过对被控侵权的百度输入法软件进行测试并勘验源程序,被控侵权的百度输入法软件根据用户输入自造词的总次数赋予用户自造词相应词频信息(诸如00、D8D6、6OEA、61EA、62EA)
未统计用户自造词占所有用户所有自造词的概率。鉴定人按照搜狗公司举证的方法独立进行了试验,人为修改了Uz2.bin中记载词频的代码,程序可正常运行,且显示数据越小候选词出现的顺序排序越靠后,可佐证被控侵权的百度输入法软件未统计用户自造词出现的频率。
(三)“词频”和“概率”属于既不相同且不等同的技术手段。
一审法院认为,百度输入法根据用户输入自造词的次数赋予自造词词频,而涉案专利权利要求1根据用户输入二元对的次数,统计二元对出现的概率,涉案专利权利要求书及相关专利审查文档已明确区分“频次”和“概率”的不同含义,因此,在专利侵权判断中,应直接认定为不同的技术特征,而不再考虑二者是否构成等同。搜狗公司认为,根据涉案专利说明书第[0118]段记载,“本实施例采用的计算方法是:根据用户词频、用户字词相邻出现的概率以及系统词频、系统字词相邻出现的概率,计算每种组词结果的概率。具体方法是:用组词结果中所有词的一元概率(即词频)的乘积,再乘以相邻两个词之间的二元概率”,词频能够与概率进行比较,属于相同类型,因此应属于等同的技术特征,一审法院不予采纳。鉴定意见认为二者不构成等同的结论,一审法院赞同,但理由不认同。
五、关于特征4“建立用户多元库,将所述用户字词对及其相邻出现的概率保存到所述用户多元库”的比对
经查实,被控侵权的百度输入法软件保存了隐式自造词的信息。
基于以上比对分析,搜狗公司拥有的涉案专利与两百度公司百度输入法软件的不同之处体现在计算机存储和统计相邻词的方法。被控侵权的百度输入法软件未记录相邻词的相邻关系,也未统计相邻词出现的概率,与涉案发明专利权利要求1构成既不相同,也不等同的技术方案,没有落入涉案专利权利要求1的保护范围
在被控侵权的百度输入法软件与涉案专利权利要求1的技术特征既不相同,也不构成等同的情况下,百度输入法软件未落入涉案专利权2、3、4、5、6、7、8、16、17、18、19、20、2122、23的保护范围。
三被告的其他抗辩理由无须再作评析,搜狗公司的全部诉讼请求,均予以驳回。
一审法院依照《中华人民共和国专利法》第十一条第一款、第五十九条第一款、《最高人民法院关于审理侵犯专利权纠纷案件应用法律若干问题的解释》第七条之规定,判决:驳回原告搜狗公司的全部诉讼请求。本案一审案件受理费人民币81,800元,司法鉴定费用人民币150,000元,鉴定人员出庭费用人民币49,044元,均由搜狗公司负担。
二审中,上诉人搜狗公司向本院提交了三份公开出版物作为新证据:证据1.《NLP汉语自然语言处理原理与实践》;证据2.《机器学习算法原理与编程实践》;证据3.《现代生活中的统计学和概率论》,上述证据用以证明本领域技术人员可以判断词频和概率之间具有相同含义。两百度公司发表质证意见认为,上述三份证据搜狗公司在一审中可以提交但未提交,故均不属于二审新证据。两百度公司认可三份证据的真实性、合法性,但对关联性不予认可。理由在于:1.根据相关司法解释规定,“人民法院对于权利要求,可以运用说明书及附图、权利要求书中的相关权利要求、专利审查档案进行解释。说明书对权利要求用语有特别界定的,从其特别界定。以上述方法仍不能明确权利要求含义的,可以结合工具书、教科书等公知文献以及本领域普通技术人员的通常理解进行解释。”本案中,涉案专利说明书、国家知识产权局专利复审委员会出具的《无效宣告请求审查决定书》足以界定“概率”的定义,不需要结合其他文献来确定。2.上述三份证据均不是输入法领域的工具书或教科书,其中两本书出版日期为2017年,而涉案专利申请日为2008年,故不能用以解释涉案专利中的“概率”概念。3.涉案专利说明书对于用户词频和概率有明确的定义,且涉案专利权利要求8中将“词频”和“概率”作为两个不同的、并列的因素考虑,与搜狗公司的举证目的相矛盾。
两百度公司向本院提交了(2018)沪静证字第1554号公证书,该公证书对两百度公司进行的反证实验4等相关实验过程进行了记载,用以证明搜狗公司将输出结果单一地归结为“用户字词对”的因素是错误的。搜狗公司认可该份证据的真实性、合法性,但对关联性不予认可,认为无法达到两百度公司的证明目的。
本院认为,因搜狗公司向本院提交的三份证据为三份公开出版物,且两百度公司对该三份证据的真实性予以认可,故本院亦认可上述证据的真实性,对于该三份证据的关联性,本院将在后文中一并阐述。两百度公司提交的公证书记载了两百度公司相关反证实验,与双方争议的两百度公司是否获取了具有相邻关系的用户字词对密切相关,故本院对该份证据予以采信。
天熙公司未向本院提交新的证据。
本院经审理查明,一审查明的事实基本属实,本院予以确认。本院另查明,2015年8月12日,上海市卢湾公证处公证员随同君合律师事务所上海分所委托代理人前往位于上海市淮海中路一号柳林大厦1F-7、8的一加(上海)零售店。君合律师事务所上海分所委托代理人购买了一部一加手机(型号为:ONEA2001、Me:867271029684718),并取得了《银联POS签购单》《购物明细》、名片各一张。上海市卢湾公证处就上述购买过程出具(2015)沪卢证经字第3177号公证书。
2015年11月9日,上海市卢湾公证处公证员随同君合律师事务所上海分所委托代理人前往位于上海市漕溪北路339号百脑汇二期2F14B店铺。君合律师事务所上海分所委托代理人购买了一部一加手机(型号为:NEA2001,iMEI:867271029508818)现场取得发票号码为00154150的发票一张,开票日期为2015年11月9日,发票金额为2,750元,发票开具单位显示为天熙公司。上海市卢湾公证处就上述购买过程出具(2015)沪卢证经字第4579号公证书。
2016年4月17日,搜狗公司就涉案专利向国家知识产权局专利复审委员会出具《关于4W104282号无效宣告案件的意见陈述书》。
2017年7月18日,工业和信息化部软件与集成电路促进中心知识产权司法鉴定所出具《工信促司鉴中心[2017]知鉴字第311号司法鉴定意见书》,鉴定结论为被控侵权的百度输入法软件主题名称及技术特征1′、2′与涉案专利主题名称及技术特征1、2相同,百度输入法软件技术特征3′、4′与涉案专利技术特征34不相同亦不等同。
2017年9月19日,搜狗公司向一审法院提交《对的异议补充意见》其中记载通过输入“gaosuwoma“高速”“沃玛”并修改Uz2.bin文件中的“词频”数值对百度输入法软件进行了相关测试。
本院再查明,一审中,两百度公司针对搜狗公司C-2实验,进行了反证实验3。二审审理过程中,本院、搜狗公司和两百度公司均对百度输入法软件进行了相关测试。
一、搜狗公司和两百度公司在一审中的相关实验
一审中,搜狗公司对百度输入法软件进行了C-2实验,即前述一审判决相关测试(三)。针对搜狗公司的C-2实验,两百度公司进行了反证实验3,实验情况如下:
清空词库,恢复默认词库,并进行下列输入:
第一步
输入“tianming”""上屏“天命”
输入“huijia""”上屏“会加”,回车
输入“huijia""”上屏“会加”
输入“dapai”""上屏“大排”,回车
第二步
输入“tianming”""上屏“天命”
输入“huijia""”上屏“会加”,回车
输入“huijia”""上屏“会加”
输入“dapai”""上屏“大排”,回车
第三步
输入“tianming""”上屏“天明”,回车
输入“dapai”上屏“打牌”,回车
第四步
输入“tianming”上屏“天明”,回车
输入“dapai”""上屏“打牌”,回车
第五步
摄入“tianming”上屏“天明”,回车
输入“dapai”上屏“打牌”,回车
第六步
输入“tianminghuijiadapai,候选项第一项为天明会加打牌
两百度公司认为,上述实验采用了与搜狗公司C-2实验同样的词组、次数,仅将搜狗公司C-2实验中的步骤1和3互换,使得词汇的存储位置不同,在步骤6中出现的候选结果与搜狗公司C-2实验的结果亦存在差异,证明搜狗公司将输出结果单一地归结为“用户字词对”的因素是错误的。词组存储位置不同也会导致组词拼接结果不同。
二、搜狗公司和两百度公司在二审中的相关实验
二审中,针对搜狗公司C-2实验,两百度公司进行了反证实验4;针对两百度公司反证实验3、4,搜狗公司进行了C-3实验;针对搜狗公司C-3实验,两百度公司进行了反证实验5。相关实验情况……
两百度公司认为,以上实验表明,虽然两百度公司采用了与搜狗公司同样的词组、次数,仅仅是没有输入所谓的“用户字词对”,在步骤6出现的候选结果即候选项第一项依然是“天命会加大排”,与搜狗公司C-2实验结果一致,从而证明搜狗公司将输出结果单一地归结为“用户字词对”的因素是错误的。即便没有所谓的“用户字词对”,百度输入法软件的输出结果依然与C-2实验结果一致。
搜狗公司认为,C-3实验中,在“天命”上屏的情况下能够在候选栏中推荐显示出候选项“会加”,且在“会加”上屏的情况下能够在候选栏中推荐显示出候选项“大排”,说明百度输入法软件中存在词对“天命-会加”以及“会加-大排”,且这两对用户词对参与了验证阶段的组词过程。以两百度公司反证实验4步骤进行对照的实验分析,在“天命”上屏的情况下,没有在候选栏中推荐显示出候选项“会加”。在“会加”上屏的情况下也没有在候选栏中推荐显示出候选项“大排”。虽然C-3实验与两百度公司的反证实验4在各自的步骤6中给出相同的六字候选“天命会加大排”,但至多说明两实验分别根据不同的计算机制计算出的组词首选项结果相同(即恰巧得出了相同的结果),其并不能证明两实验的计算机制本身是完全一致的,也无法证明百度输入法软件不存在词对机制。
(三)两百度公司反证实验5
清空词库,恢复默认词库……
两百度公司认为,搜狗公司将C-3实验中出现候选词“会加大排”这一现象唯一地归结为“词对”原因,这一证明逻辑是错误的。百度输入法软件采用“整词”的算法,依然可以出现搜狗公司C-3实验中的现象。在上述反证实验5中,“天”“会”上屏之后,均出现了“命会加”和“加大排”两个候选词。而在先前的训练阶段,用户均没有输入所谓的“天一命会加”和“会一加大排”这两组“词对”。因此,“天”上屏之后,出现的候选词“命”和“命会加”,以及“会”上屏后,出现的候选词“加”“命”和““加大排”充分说明了百度输入法软件是将“天命”“天命会加”“会加”“会加大排”作为四个整词存储。并且当用户输入整词的前序部分字时,百度输入法软件会将后续部分的字作为一个整词候选词显示给用户,百度输入法软件没有落入涉案专利权保护范围。
三、本院在二审中的相关实验
本院认为,本案二审有三个争议焦点:一是被控侵权的百度输入法软件是否落入涉案专利权保护范围;二是本案一审的举证责任分配是否合理;三是一审法院是否妨碍了搜狗公司举证质证权利。
一、被控侵权的百度输入法软件是否落入涉案专利权保护范围
本案中,搜狗公司指控两百度公司开发并向社会公众提供的被控侵权的百度输入法软件落入涉案专利权利要求1、2、3、45、6、7、8、16、17、18、19、20、21、22、23的保护范围。其中权利要求1、7、16、22为独立权利要求,其余权利要求为各独立权利要求的从属权利要求。搜狗公司、两百度公司均确认,涉案专利权利要求7涵盖了权利要求1的全部技术内容,权利要求16是与权利要求1对应的装置权利要求,权利要求22是与权利要求7对应的装置权利要求,被控侵权的百度输入法软件与涉案专利权利要求1的技术特征比对,是本案侵害发明专利权纠纷案件审理的基础。
涉案专利权利要求1,可分解为如下技术特征:前序部分为一种建立用户多元库的方法;特征部分:1.在用户输入过程中,记录所述用户对句子的输入和对上屏词的选择操作;2.根据所述用户输入的上屏方式获取具有相邻关系的用户字词对,所述用户字词对包括至少两个相邻的用户字词;3.记录所述用户字词对在所述用户输入时出现的总次数,统计所述用户字词对在所述用户输入时相邻出现的概率;4.建立用户多元库,将所述用户字词对及其相邻出现的概率保存到所述用户多元库。
搜狗公司在二审中明确,对于上述技术特征,除涉及概率的技术特征主张构成等同外,其余均主张相同。
根据一、二审庭审演示及两百度公司相关陈述,被控侵权的百度输入法软件技术特征为:一种建立用户词库的方法;1′.在用户输入过程中,记录用户对句子的输入和对上屏词的选择操作;2′.根据用户输入的上屏方式获取用户自造词,当用户进行两次连续的直接上屏输入时,将用户本次输入的上屏词和用户输入的上一上屏词拼接成一个整词,将该整词设置为隐式自造词;3′记录隐式自造词在用户输入时出现的“词频”;4′建立用户词库,将隐式自造词及其“词频”保存到用户词库。
本院对两者技术特征比对分析如下:
1.关于前序部分的比对分析
搜狗公司认为,涉案专利权利要求1中“一种建立用户多元库的方法”并非涉案专利的前序部分,其系涉案专利权利要求1的主题名称。百度输入法软件亦是一种建立用户多元库的方法,其具有相同的技术特征。两百度公司则认为,根据《专利法实施细则》第21条规定,一审法院将“一种建立用户多元库的方法”认定为前序部分正确。百度输入法软件存储的是整词,不存储有相邻关系的用户字词对,不存在用户多元库,其是一种建立用户词库的方法,一审法院关于二者属于相同技术领域而非相同技术特征的认定无误。
本院认为,主题名称是前序的一部分,对权利要求的保护一般具有限定作用,但其实际限定作用应取决于其对权利要求保护的产品或方法产生了何种影响。如果主题名称仅是对全部技术特征所构成的技术方案的概括,而非技术特征的限定,则其对权利要求的限定作用一般限于确定专利技术方案所适用的技术领域。技术领域由本领域普通技术人员通过阅读权利要求和说明书即可明确。本案中,涉案专利权利要求1前序部分为“一种建立用户多元库的方法”,其系涉案专利权利要求1的主题名称。涉案专利权利要求1特征部分描述了完整的建立用户多元库的技术方案,“建立用户多元库”的表述亦出现在权利要求1的特征部分,故主题名称“一种建立用户多元库的方法”仅系对权利要求1全部技术特征所构成技术方案的概括,限定了涉案专利技术方案所适用的技术领域。根据涉案专利说明书可知,涉案专利提供了一种建立用户多元库的方法及装置,通过对用户输入行为过程进行学习,对每个用户得到用户组词信息,从而利用用户组词信息使用户词真正参与到智能组词过程中。该用户多元库是与系统多元库相对应,用于存储用户输入的字词对和该字词对相关信息的词库。百度输入法软件包含了一种建立用户词库的方法,用户词库与系统词库、系统二元库相对应,用于存储用户输入的用户自造词和该自造词相关信息的词库,该用户自造词亦要参与到智能组词过程中。故百度输入法软件用户词库与涉案专利用户多元库均是用以存储用户自造词及其相关信息的词库,二者存储的用户自造词均需参与到智能组词过程中。本领域普通技术人员通过阅读权利要求和说明书即可明确,二者的技术领域相同。
2.关于1和1′的比对分析
根据演示实验可知,百度输入法软件记录了用户对上屏词的选择操作,也记录对句子的输入。两百度公司亦确认,百度输入法软件存在该项技术特征。故1和1′技术特征相同。
3.关于2和2′的比对分析
双方对于该技术特征的分歧在于,“具有相邻关系的用户字词对”的解释及百度输入法软件是否获取了具有相邻关系的用户字词对。
(1)关于“具有相邻关系的用户字词对”技术特征范围的界定搜狗公司认为,相邻的上屏词即为“具有相邻关系的用户字词对”,原审判决将技术特征2解释为不仅要求记录“相邻的两个词”,还记录“该两个词之间的相邻关系”,而记录“该两个词之间的相邻关系”就是要记录两个词相邻出现的概率,从而将权利要求1中技术特征3、4的内容读入了技术特征2中,错误解释了技术特征2,进而导致错误认定百度输入法软件不具有与技术特征2相同的技术特征。两百度公司认为,“具有相邻关系的用户字词对”是指有多元关系或多元信息的字或词的组合,具体来说应当包含两层含义:一是字或词的组合;二是字或词之间的“相邻关系”,即谁和谁相邻。本领域技术人员在计算“概率”时亦必须明确是谁和谁之间的二元关系。以“外面正在”为例,涉案专利计算的是“外面-正在”在所有用户二元对中的概率,而不是“外面正在”的概率。
本院认为,涉案专利说明书[0005]段记载:“二元信息是指系统通过统计学习的方法记录的词与词之间的相邻关系,如‘天气-好热’‘我-知道’等就具有二元关系。”[0058]段记载:“所述用户二元库通过记录用户对句子的输入和对上屏词的选择,记录或更新同一句子中两个相邻输入的用户词之间的用户二元关系。”[0069]段记载:“所述用户二元信息与系统二元信息类似,是指在用户输入过程中具有相邻关系的用户字词对。例如,用户输入‘外面正在下雨’,其中外面正在’和‘正在下雨’就是两个用户二元对。”[0074]段记载:“用户输入拼音串屏结果中获取相邻的字词对,得到‘他-正在’和‘正在-做饭’。”[0075]段记载:“本发明实施例是以二元信息为例进行的说明,但根据应用需要,还可以获取三元或更多元信息来建立用户多元库,例如‘他-正在-做饭’即为一个三元对。”从上述记载可知,涉案专利对自造词中的二元关系作了区分,并在此基础上实现了发明效果。故“具有相邻关系的用户字词对”包含两层含义:一是字或词的组合;二是字或词之间具有相邻关系,即谁与谁相邻。
此外,从涉案专利说明书[0086][0096]段可知,在“统计所述用户字词对在所述用户输入时相邻出现的概率”时,对于同一个句子,根据用户对句子的输入和对上屏词的不同选择,也会分别统计不同的二元对分别出现的概率。一审法院引用[0096]段记载,旨在说明涉案专利对自造词中的二元关系作了区分,并非是将技术特征3、4的内容读入技术特征2中,故本院对于搜狗公司的该项上诉理由不予支持。
(2)百度输入法软件是否获取了具有相邻关系的用户字词对搜狗公司认为,C-2实验已经证明百度输入法软件获取了用户字词对,并在组词过程中使用了用户字词对。百度输入法软件将获取的相邻用户字词对拼接为一个整词存储、还是词对分别存储,或者相邻用户词放在一起既可以作为整词被调用、也可以作为词对被调用,均与技术特征2无关。两百度公司认为,百度输入法软件采用的是“隐式自造词”的技术方案,即当用户进行连续两次直接上屏输入时,将用户本次输入的上屏词和用户输入的上一个上屏词拼接成一个词,作为用户自造词存入用户词库。百度输入法软件采用整词的存储方式,没有获取相邻关系的用户字词对。对此,本院认为,根据涉案专利权利要求及说明书的相关解释,涉案专利对自造词中的二元关系作了区分。而百度输入法采用整词的存储方式,并没有获取相邻关系的用户字词对。理由如下:
首先,涉案专利通过用户对上屏词的不同选择操作,可以形成具有不同相邻关系的二元对。以四字自造词“握药毁假”为例,涉案专利可以形成“握-药毁假”“握药-毁假”“握药毁-假”三种二元对。而在一审勘验源程序时发现,百度输入法软件按照同一种算法,记录了用户对上屏词的选择以及用户的一次直接上屏词,储存了“握药”“毁假”以及“握药毁假”三个词的信息,根据输入字的时间先后顺序排列储存在计算机中,当“握药”为一个词的时候,“药”排在“握”的位置后面;当“毁假”为一个词的时候,“假”排在“毁”的位置后面;当“握药”和“毁假”组成一个自造词时,计算机程序将“毁假”的位置信息排在“握药”的位置信息之后,据此,当“握药毁假”为一个词的时候,“握”“药”“毁”“假”的位置顺序依次排列,并不含有“握药”与“毁假”为一对的信息。若以“握”和“药毁假”组成“握药毁假”,或者以“握药毁”和“假”组成“握药毁假”,用户词库中记录“握药毁假”的编码是相同的,未区分“握-药毁假”“握药-毁假”“握药毁-假”的不同组合。而从一审的相关实验看,输入“握-药毁假”“握药-毁假”“握药毁-假”时,z2.bin文件记录的“握药毁假”编码相同。在本院设计的实验一中,在连续输入“卧-药毁假”“卧药-毁假”“卧药毁-假”各3次时,Uz2.bin文件代码显示“卧药毁假”从D8D6增加到65EA,亦说明了百度输入法并未区分“卧-药毁假”“卧药-毁假”“卧药毁一假”的不同组合。搜狗公司在二审中主张,Uz2.bin文件中没有词对记录不能证明百度输入法软件不存在用户字词对,但其并未向法庭指明用户字词对在百度输入法软件目标程序中的存储位置,故本院对搜狗公司的该项主张不予支持。
其次,在两百度公司的反证实验3中,两百度公司采用了与搜狗公司同样的词组、次数,仅将搜狗公司C-2实验中的步骤1和3互换,使得词汇的存储位置不同,在步骤6中出现的候选项第一项为“天明会加打牌”,与搜狗公司C-2实验的结果存在差异。在两百度公司的反证实验4中,两百度公司采用了与搜狗公司同样的词组、次数,仅仅是没有输入“用户字词对”,在步骤6出现的候选结果即候选项第一项依然是“天命会加大排”,与搜狗公司C-2实验结果一致。通过两百度公司的上述实验,本院难以将搜狗公司C-2实验中百度输入法软件候选项第一项为“天命会加大排”的原因归结为“用户字词对”的因素。
再次,在搜狗公司C-3实验中,搜狗公司认为,在“天命”上屏的情况下能够在候选栏中推荐显示出候选项“会加”,且在会加”上屏的情况下能够在候选栏中推荐显示出候选项“大排”说明百度输入法软件中存在词对“天命-会加”以及“会加-大排”且这两对用户词对参与了验证阶段的组词过程。但在两百度公司反证实验5中,在“天”“会”上屏之后,均出现了“命会加”和“加大排”两个候选词。而在先前的训练阶段,用户均没有输入“天一命会加”和“会一加大排”这两组“词对”。因此,搜狗公司的C-3实验亦难以证明百度输入法软件中存在词对“天命-会加”以及“会加-大排”。
综上,百度输入法软件并未获取具有相邻关系的用户字词对,其采用了与涉案专利不同的“隐式自造词”的技术手段,故2和2′属于不相同的技术特征,亦不构成等同。
4.关于3和3的比对分析
双方就该技术特征争议的焦点是“所述用户字词对在所述用户输入时相邻出现的概率”的解释以及百度输入法软件是否统计了“所述用户字词对在所述用户输入时相邻出现的概率”。
(1)关于“所述用户字词对在所述用户输入时相邻出现的概率”的理解
搜狗公司认为概率是可能性,在观察次数充分大的情况下可以把频次作为概率。涉案专利说明书[119]段载明“系统一元概率(相当于系统词频)”,[0162]段载明“用户词频(即用户一元概率)”“系统词频(即系统一元概率)”。两百度公司认为涉案专利中所述的概率指的是用户二元库中存储用户字词对在用户输入时相邻出现的概率,并且该概率的计算方式是T(A,B)/SUMBI,而不是泛指所有概率。本院认为,《最高人民法院关于审理侵犯专利权纠纷案件应用法律若干问题的解释》第二条规定:“人民法院应当根据权利要求的记载,结合本领域普通技术人员阅读说明书及附图后对权利要求的理解,确定专利法第五十九条第一款规定的权利要求的内容”;第三条规定:“人民法院对于权利要求,可以运用说明书及附图、权利要求书中的相关权利要求、专利审查档案进行解释。说明书对权利要求用语有特别界定的,从其特别界定。以上述方法仍不能明确权利要求含义的,可以结合工具书、教科书等公知文献以及本领域普通技术人员的通常理解进行解释。”
首先,从涉案专利说明书看,[0005]段载明“二元概率(指二元信息的使用概率)”。[0086]段记载:“当用户输入力指向’,因此用户将‘力指向’选为候选上屏词;然后对于‘布局’没有在用户词库中出现,因此‘布局’被记入用户词库,同时‘力指向-布局’二元对被记入用户二元库,之后用户又选择了‘算法’进行上屏,于是‘布局算法’二元对被记入用户二元库中。对于这些新添加到用户二元库中的二元对,计算每个二元对的两个词相邻出现的概率,这个概率值称为二元概率。”[0096]段记载:“二元对A-B’的二元概率为T(A,B)/SUMBI。其中T(A,B)为A-B二元对在用户输入时出现的总次数,SUMBI为所有用户二元对的总次数,即所有T(,)的总和。”
其次,从相关权利要求看,涉案专利权利要求8载明:“根据权利要求7所述的方法,其特征在于,通过以下方式计算每种组词结果的概率:根据用户词频、用户字词相邻出现的概率以及系统词频、系统字词相邻出现的概率,计算每种组词结果的概率。”涉案专利说明书第[0120]段记载:“通过词频和二元概率的累计相乘,得到整条路径的概率。”本院认为,当权利要求中出现不同的术语指代相关概念时,一般情况下,应当认为它们的含义有所不同,不宜解释为相同含义。涉案专利权利要求和说明书均将词频和概率采用了不同的表述,因此本案中概率和词频不应解释为具有相同含义。
再次,从专利审查档案看,2016年4月17日搜狗公司《关于4W104282号无效宣告案件的意见陈述书》第25页载明:“在本专利权利要求1中,用户字词对的概率是在用户输入时相邻出现的概率,表示该用户字词对的使用频率,因此,用户字词对的概率是相对于用户输入的所有字词对来说的。举例来说,假设所有的用户二元对包括A-B、A-C、B-C,则用户多元库为用户二元对A-B保存的概率表示用户输入过程中A-B相对于A-b、A-c、b-c中出现的可能性。”第37页载明:“在本专利权利要求1中,用户多元库中保存的概率,即用户字词对在用户输入时相邻出现的可能性,也就是说,这个概率是相对于用户所有可能输入的相邻字词对来说的,表示的是该用户字词对在用户所有可能输入的相邻字词对中出现的可能性”。2016年10月24日,国家知识产权局专利复审委员会对涉案专利作出《无效宣告请求审查决定书》(第30349号),其中第22页记载:“权利要求1中的用户字词对相邻出现的概率也可称为多元概率,是指多元信息的使用概率。基于本专利的整体发明构思来看,权利要求1中的用户字词对相邻出现的概率是以用户各次的历史输入作为统计范畴的,统计的是在用户输入过程中目标多元组作为一个整体出现的概率,其数学含义是,针对用户输入情况下,以用户输入的所有相邻情况为统计基数(分母),以用户输入过当前多元对的次数为分子,所计算得到的概率。也就是说,权利要求1中的概率是指一个多元组作为一个整体出现的概率,它是基于统计得出的,是对整体性的估算。”该决定第24页记载:“在权利要求1的用户多元库中为用户字词对保存的概率则是用户输入时相邻出现的概率,即用户字词对在用户输入时相邻出现的可能性,也就是说,这个概率是相对于用户所有可能输入的相邻字词对而言的,其表示的是该用户字词对在用户所有可能输入的相邻字词对中出现的可能性。”
综上,结合涉案专利说明书、相关权利要求和相关专利审查档案,“所述用户字词对在所述用户输入时相邻出现的概率”应作如下理解:以二元对为例,二元概率是指二元信息的使用概率,即该用户字词对在用户所有可能输入的相邻字词对中出现的可能性,计算公式为T(A,B)/SUMBI,其与词频的含义不同。根据前述《最高人民法院关于审理侵犯专利权纠纷案件应用法律若干问题的解释》第三条之规定,本案涉案专利说明书、权利要求书中的相关权利要求、专利审查档案足以确定涉案专利权利要求中概率的含义,故无需结合工具书、教科书等公知文献进行解释,故本院对搜狗公司所提交的三份公开出版物的关联性不予确认。
(2)百度输入法软件是否统计了“所述用户字词对在所述用户输入时相邻出现的概率”
搜狗公司认为,百度输入法软件统计了用户词频,概率与频次虽然数学含义不同,但从词出现的可能性角度来说,“词频”和“概率”属于等同的技术特征,是本领域技术人员无需创造性劳动就可以联想到的。两百度公司认为,百度输入法软件仅统计了用户词被输入的次数,没有统计用户词出现的概率。“词频”与“概率”属于既不相同也不等同的技术手段。
对此,本院认为,首先,一审法院对百度输入法软件源代码勘验显示,百度输入法软件用户自造词输入时的记录方式为0、550060006000602.bin文件中存储的十六进制编码为(o00、D8D6、60EA、61EA、62EA)。可见百度输入法软件根据用户输入的次数,赋予用户词一个数值,一审鉴定专家称之为“频度”或“词频”。而涉案专利中用户字词对出现的概率,以二元对为例,二元概率是指二元信息的使用概率,其计算公式为T(A,B)/SUMBI。可见,涉案专利的概率受用户输入二元词对的总次数SUMBI影响,而从现有的勘验和相关实验结果看,百度输入法软件的词频并不受用户输入用户词总次数的影响。
其次,如前所述,涉案专利权利要求8和说明书相关记载明确区分“词频”和“概率”的不同表述。涉案专利说明书0007]段也对用户词频作了解释,“对于用户词库中的词条,客户端会根据用户输入这个词条的频率和最后一次输入这个词条的时间来对词条赋予一个频率,称为用户词频。”因此“词频”和“概率”具有不同含义,属于不同的技术手段,不构成等同的技术特征,故3和3′不相同,亦不等同。
5.关于4和4′的比对分析
因百度输入法软件并未获取具有相邻关系的用户字词对,且亦未统计用户字词对在用户输入时相邻出现的概率,其仅将隐式自造词及其“词频”保存到用户词库中,故4和4′属于不同的技术特征,亦不构成等同。
综上,被控侵权的百度输入法软件并未落入涉案专利权利要求1的保护范围。因百度输入法软件与涉案专利权利要求1的技术特征比对,是本案侵害发明专利权纠纷案件审理的基础,故百度输入法软件亦未落入涉案专利权利要求2-8、16-23的保护范围。
二、本案一审的举证责任分配是否合理
搜狗公司主张,其C-2实验测试结果表明,百度输入法软件不只存储了整词,也存储了二元词对,并在组词中调用了二元词对。故搜狗公司已经从百度输入法软件的操作现象和功能上证明了百度输入法软件实现了涉案专利所实现的技术效果,举证责任应当转移至两百度公司。而两百度公司没有提交证据证明百度输入法软件采用了不同于涉案专利保护的技术方案去实现专利所要实现的技术效果,应当承担不利法律后果。两百度公司认为,两百度公司针对搜狗公司的每一个实验均有反驳和实验,也提供了验证实验和源代码以证实百度输入法软件没有落入涉案专利权保护范围,两百度公司已经尽已所能举出了所有证据,搜狗公司的该项上诉主张不能成立。
对此,本院认为,计算机软件专利权人指控被控侵权软件侵犯了涉案专利权,应当对该软件相关技术特征落入涉案专利权的保护范围承担举证责任。但鉴于在计算机软件专利侵权案件中,被控侵权软件实现某种技术效果及功能的过程通常为终端用户所不可见,故需结合当事人的举证能力,现象与方法流程的对应关系等合理分配当事人的举证责任。一般而言,计算机软件专利权人应至少在现象上证明被控侵权软件具备了涉案专利限定的全部功能,被控侵权的基本事实具有高度可能性。在其完成上述初步举证责任的情况下,举证责任应当转移至被告。被告需举证证明虽然实现了同样的技术功能和效果,但其采用了有别于涉案专利的技术方案。本案中,搜狗公司提出了C-2等相关实验以证明百度输入法软件在组词过程中存储并调用了二元词对,而两百度公司进行了一系列反证实验,证明其采用的是“隐式自造词”的技术方案,将两次直接上屏的词拼接成一个整词进行存储,不存在具有相邻关系的用户字词对,也未统计并存储用户字词对在用户输入时相邻出现的概率。且两百度公司亦向一审法院提交了被控百度输入法软件源代码进行勘验。因此,在搜狗公司进行相关实验后,两百度公司已经尽到了相应的举证责任,一审法院对于搜狗公司和两百度公司的举证责任分配并无不当,搜狗公司关于举证责任分配不合理的上诉理由不能成立,本院不予支持。
三、一审法院是否妨碍了搜狗公司举证质证权利
搜狗公司主张,一审法院在诉讼程序中,严重损害了搜狗公司对证据的质证权利和针对性地对两百度公司主张进行反驳的权利。且一审法院只按照两百度公司事前提供的《关于现场勘验方案的说明》进行片面勘验,限制了搜狗公司获知两百度公司提供证据的权利。两百度公司认为,一审法院充分给予搜狗公司足够时间和机会对相关证据进行质证,源代码勘验亦系在法官、技术调查官、鉴定专家及搜狗公司、两百度公司均在场的情况下进行的,其相关质证权利受到损害的主张不能成立。
对此,本院认为,本案涉及百度输入法软件用户词库的实现方式,一审法院根据两百度公司的申请,对百度输入法软件技术事实查明部分不公开审理并无不当。搜狗公司主张的两百度公司相关抗辩意见及说明属于当事人的意见陈述,相关说明中包含百度输入法软件的设计理念及实现方式,且一审法院已充分给予搜狗公司足够时间和机会对相关材料进行阅看。另外,经向参与一审源代码勘验的相关鉴定专家核实,在一审法院的主持下,搜狗公司和两百度公司的委托诉讼代理人及专家辅助人、技术调查官、相关鉴定专家对百度输入法软件源代码进行了查验,搜狗公司有充足的时间对百度输入法软件源代码进行阅看。故搜狗公司关于勘验片面且限制了搜狗公司获知两百度公司提供证据的权利,损害搜狗公司对证据的质证权利和针对性地对两百度公司主张进行反驳的权利的相关上诉理由不能成立,本院不予支持。
综上所述,搜狗公司的上诉请求不能成立,应予驳回。依照《中华人民共和国民事诉讼法》第一百七十条第一款第(一)项之规定,判决如下:
驳回上诉,维持原判
二审案件受理费人民币81,800元,由上诉人北京搜狗科技发展有限公司负担。
本判决为终审判决。
审判长 薛 林
审判员 马剑峰
审判员 张 莹
二〇二〇年三十日
法官助理 董尔慧
书记员 ***
来源:知产宝
2020年中国法院10大知识产权案件:
1.最高法院提审,“小i机器人”专利复活,苹果公司再陷侵权风波?【附文字版判决书】
2.最高法知产庭2020年典型案例(二):华为诉康文森:中国法院首次在知识产权领域作出具有“禁诉令”性质的行为保全裁定
3.“红牛”案二审,最高法院:“商标所有者的合法权益”即商标权,红牛饮料主张没有法律依据,驳回上诉!
4.最高法知产庭:集成电路布图设计的保护范围、登记性质及独创性认定
5.最高法院:宋祖兴作隐名股东违反竞业限制和保密义务,应退还奖励补偿款、承担违约金共计13668801.17元
6.深圳中院:OPPO与夏普株式会社、赛恩倍吉日本株式会社标准必要专利实施许可合同纠纷,中国法院具有管辖权
7.江苏高院:游戏《新斗罗大陆神界篇》侵害小说《斗罗大陆》改编权判赔500万,不停止侵权,发行公司不侵权
8.杭州铁路运输法院:浙江搜道网络、杭州聚客公司利用Xposed外挂操作微信,构成不正当竞争,赔260万元
9.北京知产:①KTV企业无资格向法院诉著作权管理组织拒绝与其订立许可使用合同;②音集协被诉行为不构成滥用市场支配地位垄断行为
10.上海高院:“乐拼”仿冒3.3亿“乐高”玩具,构成侵犯著作权罪,主犯获刑6年、罚款9000万
2020年中国法院50个典型知识产权案件:
◆【IP控控判例汇编(第四集)】:IP控控2019年判例汇编◆【IP控控判例汇编(第五集)】:2019年中国法院10大知识产权案件+50件典型案例合辑【附判决书链接】◆【IP控控判例汇编(第六集)】:最高法院知识产权法庭2019年40个裁判规则及判决书链接
◆ IP控控|商标评审简讯(2019年合辑)◆最高法院:知识产权判决执行工作指南【附:最高法院2020年发布的司法解释合辑】◆ 合辑|2020年12月31日发布的十八司法解释修改比对【附:WORD版下载】