专利分析检索
封面图片来自网络
对专利分析有所了解的朋友们应该知道,专利分析项目的一般流程为:确定分析目的及目标→ 研究背景资料 → 项目分解 → 数据采集→ 建立报告框架 → 制作专利地图 → 报告撰写(包括图表解读和综合分析)→ 统稿。
那么,专利检索是数据采集的主要工作内容,如果把最终的专利分析报告比作一桌菜的话,数据采集就相当于购买做菜的原材料。
下图是专利分析检索的一般流程,从明确检索目标开始,要经过多个不同阶段的各种调整补充,达到一定的查全查准率,才能终止检索。
那么做专利分析的时候,除了常规的专利数据库以外,还需要补充什么方面的信息?
根据专利分析的目的,有时除了专利文献信息;还需要检索商业信息(企业财报、行业年报等)、科技文献、商标等;专利文献数据库的选择还需要参考许可转让、法律状态、引文、复审无效、司法判例、同族、技术领域、数据获取效率、数据全面性等指标。
专利分析检索的过程,与钓鱼相似,可以分为:摸鱼(使用预检索了解基本情况)→ 网鱼(块检索、面检索、分框检索、总分/分总式检索)→ 钓鱼(补充检索、追踪检索、点检索)。
专利文献中的分类号相当于身份证号码的前六位,能够最快的帮助我们了解技术所在领域以及所包含的技术内容。如果不了解如何使用分类号进行检索,通常很难达到文献查全性的标准。
目前常用的分类号有IPC、CPC、FI/F-Term、EC、ICO、UC、DC/MC等,在不同分类号体系中的技术要素的表达不同。
单独用关键词进行检索会出现很多噪声,但是相对于分类号,关键词可以对技术细节进行直观描述,弥补分类号的不足。
同时,还要特别注意使用关键词在所分析行业领域内的统一/规范表达。这些表达可以通过检索过程中阅读文献积累,或者通过查阅期刊文献积累的哟。
检索过程中还需要注意两种人:
1.有些行业,申请人数量比较有限,可以针对申请人/发明人进行特定检索;
2.补充检索也可以从申请人/发明人字段入手;
3.申请人/发明人字段也可以用于查全性和查准性的取样。
如果是针对复审、无效程序进行的检索,查准即达到目的;但涉及领域分析、行业调查时,查全性则十分重要。
一般来说,中文文献的查全率要在90%以上,外文文献的查全率要在80%。而中文文献的查准率应该在95%左右,而外文文献的查准率也要在80-85%。
那么查全查准如何评估?
查全率评估的方法:基于申请人/发明人“技术链”、基于技术分支“纵切面”、基于引证“关系链”、数据库“比拼”。
查准率评估的方法:基于申请人/发明人“技术链”、基于年代“横切面”(比较常用)、基于技术分支“纵切面”、基于国别/地区抽样、随机抽样。
查全性评估不达标准,要进行补充检索,然后反复进行查全性评估,直到达到标准;
查准性评估不达标准,要进行除噪处理,然后反复进行查准性评估,直至达到标准。
一般而言,不相关的文献是由于数据库本身、关键词、分类号等复杂原因引起的。
去除检索过程带来的噪音需要弄清楚噪音的来源。一般而言,不相关的文献是由于数据库本身、关键词或分类号等原因引起的。检索的时候,可以通过阅读专利文献,提取噪音词汇或者噪音分类号,批量去噪音,非常好用哦。
上图示出了分析检索的种类,根据不同种类,应当结合不同的策略进行检索。
本期内容来自2017年国家知识产权局的相关公益讲座。
文源:专利分析师
作者简介:
马天旗,就职于国家知识产权局专利局机械发明审查部;主编《专利分析-方法、图表解读与情报挖掘》、《专利布局》、《专利挖掘》,参与撰写《专利分析实务手册》等书。
推荐课程:报名| 专利信息分析从业人员高级研修班【重庆,广州,南京】