其他
企研数据处理工作论文系列 | 专利库与工商库匹配报告(下)
(二)中国工商企业数据库简介
二、专利数据与工商数据匹配过程 (一)数据匹配流程
(二)数据预处理
(三)数据匹配过程三、匹配结果及进一步考察
本文承接自:企研数据处理工作论文系列 | 专利库与工商库匹配报告(上)
公众号内回复关键词“WP0007” 或 打开浏览器搜索http://paper.qiyandata.com/WP0007.pdf 即可获取全文PDF版!
摘要:本文通过将中国专利数据库(以下简称“专利数据”)与中国全量工商企业注册数据库(以下简称“工商数据”)进行横向匹配,构建完整的“中国全量企业专利数据库”。相较于其他学者通过专利数据与中国规模以上工业企业数据库(简称“工企数据”)匹配得到的“中国规上工业企业专利数据库”,本文所构建的“中国全量企业专利数据库”涵盖了中国不同所有制,所有规模企业的专利信息,能够更加全面地刻画中国企业的专利创新。
二、专利数据与工商数据匹配过程
(三)数据匹配过程
1. 企业全称精确匹配
[4] 唯一匹配是指同一个专利申请人名称在企业名称拉链表中仅匹配到一个企业ID。非唯一匹配则是指同一个专利申请人名称在企业名称拉链表中匹配到两个及以上的企业ID。而无法匹配是指专利申请人名称不存在于企业名称拉链表之中。
2. 企业名称主干精确匹配
(1)企业名称主干+省份
(2)企业名称主干
3. 非唯一匹配结果筛选
三、匹配结果及进一步考察
表1 专利数据和工商数据匹配结果
表2专利数据中无法与工商库匹配的专利情况分析
表3 1985-2018年三类专利的匹配结果
END
公众号内回复关键词“WP0007” 或打开浏览器搜索http://paper.qiyandata.com/WP0007.pdf 即可获取全文PDF版!
加入企研·社科大数据平台数据分享群,获取更多数据资源及新鲜资讯
星标⭐我们不迷路!
想要文章及时到,文末“在看”少不了!
往期推荐