查看原文
其他

对话果汁局专家,专利检索如何有效去重去噪

2016-05-09 智慧芽学院 智慧芽
背景

4月22日中国电子科技集团公司知识产权中心主管/国家知识产权局专利分析师王培华老师做客智慧芽学院线上webinar,针对学员在专利检索实务中普遍遇到的疑难点进行了细致分析和解答。本文根据王培华老师的问答部分整理而成,希望会对小伙伴们的专利检索工作有些指导和启发。


1. 利用Thomson Innovation数据库中检索到的文献太多,经常超过1万条,通过文献摘要看跟检索主题相同,是否要将1万多条文献条目逐一浏览,事实上我是读过1万多条,过程很痛苦,有哪些快速的可操作性强的去噪方法?如何将同一篇专利申请的不同阶段合并?


A:快速批量去噪的方法,一般常用的是对主分类号的排序,通过主分类号的排序来实现快速批量去噪,如果想迅速马上达到效果的话,只有这一种方法。其他的方法都要通过人工浏览,浏览有一些技巧,尽量从名称和摘要里确定文献的相关度。其实在智慧芽的系统中本身有相关度的参考,所以我们也可以利用这个工具来降低我们的工作量。这是去噪的方法。关于文献的合并,指的是用A类文献B类文献这种合并,其实在所有系统里都有文献的合并,同一件专利申请各个阶段的文献的合并就选择“只显示该申请的一个文献”,这样一来A类文献B类文献就可以合并。如果说数据量特别大,合并之后数据依然很多,还可以通过同族进行合并。如果数量达到几万甚至十万,可以选择用INPADOC同族,这样数据量瞬间变小,这样可以便于我们快速的浏览。这个时候浏览的是同族家族中特别相关的文献,不需要阅读所有的同族。如果说数据量不是太大只有几千,或者在一两千以内的话,可以选择一个简单同族,来快速的浏览文献,便于减少去噪的工作量。


  2. 专利检索有哪些技巧和经验可以提高效率避免重大漏检? 

A:经验这两个字囊括的范围比较大,我就针对技巧来说说我的观点。对于漏检方面的技巧,我平时在收集检索要素的时候会在表里写一栏备注,在关键词这一项把我要求的扩展关键词的都写上,同义词,近义词,反义词,上下位,以及单复数各种形式之类的,都会写在备注里面,通过备注来提醒自己。另一个方面,我会看缩写和简称有没有都收集,如果收集了就在上面打勾或将颜色替换成红色的,做一个提示。如果没有收集,就要保留在备注里提醒自己去做这个工作。这样关键词收集的时候就比较全面,避免漏检。提高效率的方法其实并不多,检索是最基础和最繁琐的工作也特别耗时间,大家以数据结果符合要求为追求比较好。


3. 请问老师,星号*和问号?代表着什么?

A:*号和?号都是智慧芽系统中的通配符。*号代表任意个字符,问号代表一个字符。比如说问号使用的场合,比如说单复数,电路的单词,我要在电路后面加一个“s”表示复数,如果不用“s”表示也可以用问号代替它。两个单词采用两个不同的算符,比如 “MEM”和“MOM”,想通过一个检索式来实现这两个单词的检索,不用把两个单词都写进去,可以用“M?M”来检索这两个单词。这是问号的作用。*号的作用是可以代替任意个字符,假设刚才例子mechanical ,machine,这样的词语的话,应该在“h”的后面加*号,这样的话就代表了后面的任意字符。


4. 感觉分类号选择的全不全准不准关系很大,那么多分类号是不是要全背下来才行啊?不然怎么知道从这么多分类号中挑选合适的?

A:分类号选择确实工作量大,尤其在大型专题分析里面。不需要把分类号全都背下来,但是如果想熟悉分类号,最好要熟知分类号的目录A部到H部所有的分类号。比如我拿到一个主题我就知道它应该分到哪个部,就可以去那个部的目录里找,这个目录基本上从部,大类到小类是没有问题的,可以通过目录把技术归纳分析得特别准确,基本上准确到小类的位置。大组和小组并不是太大问题,这是我们在搜集检索要素时要再去下功夫的。但是在平时,一定要把小类往上的层级熟悉,这样我们在检索的时候才能做到准与全。


5. 分类号本身就有上位概念和技术分解。能不能通过一个上位的分类号➕技术分解后的关键词代替。 技术分解后的分类号➕上位关键词。 两种哪个比较好?

A:这两个都不可以代替。建议大家回头在智慧芽学院里面我去年讲过的分类号课件(专利分类号的深度解读-IPC/CPC 在检索中的使用),那里面清楚的告诉了大家分类号的分类原则,以及每一个分类号代表的含义和分类号下文献的范围。如果我取了一个分类号,那么这个分类号下的文献的技术内涵一定是这个分类号类名对应的内涵。上位概念的分类号和下位概念的分类号,只是类名的含义是上下类概念,但是文献分入哪个分类号就是哪个分类号,假设刚才的分入H02M7-00的就一定不会分到7-42,所以我要检索H02M7-42下的文献,我只需要输入7-42,不需要拿7-00作为关键词来检索,这是检索不到的,因为这个文献根本就没有在7-00这个分类号。不知道这样讲解大家是否能够理解。就是分类号类名具有上下位概念,这个第5个问题里面说的上下位指的是分类号的类名,但是分类号下的文献的范围,和类名是没有关系的,只是技术内容与7-00相关就分入7-00,和7-42相关就分如7-42。7-00下一定不具有7-42下的相同的文献。因此分类号选择一定要准确,是哪个分类号就是哪个分类号,不能去掺杂上下位。上下位这个概念我在前面关键词扩展时用到过,它指的是词语的上下位概念,分类号是通过上下位分类号来辅助我们关键词的提取和拓展。


6. 技术分解是一个非常专业的技术活,一般代理人只是本领域普通技术人员,如何才能做到这么专业的技术分解?

A:一般的代理人是不会对技术了解得那么透彻,但是我的经验是,技术分解的标准和行业标准有区别,技术人员对技术了解的比较专,比较深,但是不够广。而我们做技术分解的话会比技术人员要求的广一些。我们技术分解要结合学科的标准和专利分类号分类体系的标准,如果我们是单纯根据行业链、行业里面技术人员所了解的产业链去分解的话,这时得到文献的分解表不利于我们去收集检索要素,不利于我们去构建检索式。所以技术分解的工作需要我们去参考学术的、学科里面的课本、教材去全面的涵盖这个技术。


完整视频简介:

明确检索逻辑,合理利用关键词和分类号,构建逻辑检索式,高效查找专利并有效去重去噪,是知识产权从业人员的必备技能之一。但是,面对浩如烟海的专利文献,在做大型主题专利检索时,大家仍会有不知如何下手的感觉。


中国电子科技集团公司知识产权中心主管/国家知识产权局专利分析师王培华老师再次做客智慧芽学院线上webinar,针对全、准、快、灵的做好专利检索做了深度分享。王老师在简要叙述了专利检索的基础知识之后,通过4个机械与电学的典型案例针对如何进行技术分解、如何选择检索策略、如何进行结构化检索、如何实现数据的去噪、补充与验证等问题进行了检索实务演示。


对于大型专题的检索分析等内容非常值得学习参考,为做检索工作的同行点亮了一盏方向之灯。



点击阅读原文,立即学习!


往期回顾

【收藏版】专利分析报告怎么写? 5步法教你掌握独门秘籍



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存