其他
CCAD | 第一批数据清洗成果及代码正式公开
置顶推荐
成绩报告单 | CCAD传捷报,企研数据再助学者发文
浙大卡特-企研中国涉农研究数据库(China Academy for Rural Development-Qiyan China Agri-research Database(CCAD),Zhejiang University)[1]是由企研数据携手浙江大学中国农村发展研究院(简称“浙大卡特”)共同发起,为助力国家乡村振兴发展战略,服务“三农”和相关领域学术研究及智库建设而倾力打造的涉农研究微观大数据库。在2020版四大“企业”子库的基础上,2021年正式拓展为涉农研究微观数据库,专题子库增加了农村金融机构数据库,目前数据范畴由单一的企业微观数据库扩展为包含6个方面的“三农”及相关领域综合数据平台。因此,2021版正式更名为"中国涉农研究数据库"。
CCAD数据库构建的宗旨是提供促进中国“三农”及相关领域研究的“公共品”。按照企研数据与浙大卡特所签订协议,基于双方团队研究力量所共同完成的数据清洗成果应在云桌面上逐步分享给所有CCAD用户,目前的期限是清洗成果完成交付后一年。在此特别鸣谢浙大卡特为将原始的行政记录数据转化为更方便学者使用的数据形式提供初始清洗资金的支持。
本次公布的数据清洗结果基于的是CCAD2020版的农民合作社专题子库(2020年发布的第一版包含农民合作社、家庭农场、农业企业和农产品加工业四个微观企业数据库),由浙江大学中国农村发展研究院副教授、企研数据学术顾问梁巧老师研究团队和企研数据技术团队配合完成。
接下来,我们分如下四个部分对本次清洗成果进行展示:依次为清洗目标、原始数据与清洗成果、应用范例、清洗成果及代码的共享规则。
一、 清洗目标
如表1所示,本次数据清洗的对象是CCAD的农民合作社专题子库(含2020版和2021版),涉及的表格包括:合作社基本信息表、股东信息表、资质认证信息表、食品农产品认证信息表、行政处罚信息表、失信被执行人信息表、招投标信息表、异常经营信息表8张表格。为方便用户使用清洗后的数据,表1展示了上述表格各自所涉及的清洗内容和清洗目标。
表1 CCAD农民合作社专题子库清洗目标
二、 原始数据与清洗成果
在上述清洗内容中,难度较高的是第一项和第二项清洗内容,即合作社经营范围的梳理和合作社成员数的统计。接下来主要对这两项清洗内容做具体说明。
1、合作社经营范围
表2展示了合作社经营范围的部分清洗结果。我们以“龙门县刘村移民农林发展专业合作社”为例,其经营范围是“造林和更新;水果种植;养殖蜜蜂。(依法须经批准的项目,经相关部门批准后方可开展经营活动)”。经过清洗,得到包括“02-林业”、“01-农业”、“03-畜牧业”3个行业大类,以及“022-造林和更新”、“015-水果种植”、“039-其他畜牧业”3个行业中类。显然,清理后的合作社会被赋予多于1个行业代码。
注:当清洗得到的行业大类/中类超过3个时,本次清洗仅保留前3个。
表2 合作社经营范围清洗结果展示
2、合作社成员数
如表3所示,原始股东信息表详细列举了每家合作社的股东信息,根据合作社的性质,他们就代表合作社的成员信息,具体包括法人成员和自然人成员。为方便学术研究使用,我们需要对每家合作社的成员数进行分类汇总,统计总成员数、法人成员数和自然人成员数。值得注意的是,部分合作社的成员名称(即表中的股东名称)可能指代多个成员,例如存在“四川富万家农业科技发展有限公司等16个成员”、“周海波等6名成员共同出资”等表述。因此,我们在根据成员类型分类汇总前,需对"股东名称"这一字段先进行清洗。最终的清洗结果如表4所示。
表3 合作社成员(股东)信息表
表4 合作社成员数清洗结果展示
三、 应用范例
目前直接使用该数据清洗结果所发表的期刊论文见《农民合作社组织规模与绩效的关系探究》(《经济学家》2021年第8期,作者梁巧、白荣荣)[2]一文(点此回顾),将基于合作社股东信息表清洗得到的合作社成员数作为衡量合作社规模的代理变量,并根据经营范围清洗得到包括“农业”、“林业”、“牧业”、“渔业”和“农林牧渔服务业”在内的5个行业大类,以此作为控制行业效应的关键变量,进而研究了合作社规模对绩效的复杂影响。实证表明,合作社规模对盈余总额产生显著正向影响,而对人均盈余总额存在倒“U”型影响。
四、 清洗成果及代码的共享规则
按照企研数据与浙大卡特所签订协议,以上清洗成果将在2020年8月27日正式交付后满一年,在云桌面上分享给CCAD正式用户。CCAD全库和CCAD农民合作社专题子库使用者,自2021年8月28日起,可在云桌面内免费使用清洗成果,并且能分享到python清洗代码。
特别提醒
根据本公司与CCAD用户所签协议,若您使用以上清洗成果研究发表学术论文或研究报告,需在中文成果中标明“本论文(报告)使用数据全部(部分)来自浙大卡特-企研中国涉农研究数据库”,英文成果中标注数据来源为“China Academy for Rural Development-Qiyan China Agri-research Database(CCAD),Zhejiang University”。并且,为鼓励我国"三农"领域青年学子的科研热情,我们会对发表成果的学生作者予以奖励。若有相关疑问,或者正式用户已完成成果发表,请及时联系您的专属客服!
参考资料
浙大卡特-企研中国涉农研究数据库(CCAD): https://ccad.qiyandata.com/
[2]《农民合作社组织规模与绩效的关系探索》知网链接: https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CJFD&dbname=CJFDAUTO&filename=JJXJ202108014&uniplatform=NZKPT&v=vBbNm42B1e9CJuGLQUp0P0tbU0aDYNOKzjZfv5WlwNtwnjLV%25mmd2FQN9qsT8%25mmd2FhhU8dsK
添加客服企业微信,即刻预约CCAD账号试用
截至目前,CCAD数据库的子库列表:
家庭农场数据库 农产品加工业数据库 农民专业合作社数据库
国家示范社专题子库(筹) 农业企业数据库 涉农金融机构数据库 新增拓展数据(点击可查看详情):
农业生产 资源环境
全国排污许可证数据库 中国灾情数据库 城市空气质量日更新数据库 全国和省级年度土地利用现状数据库 能源企业公示信息数据库 耕地与地块信息公开数据库 长江水利行政许可信息数据库 全国矿产地数据库 水利部公示信息数据库 采矿行政许可信息数据库 重点排污企业监测信息数据库 PM2.5数据库 农村发展 农产品市场 食品经济 农业科技 其他
全国行政官员信息数据库 农业上市公司数据库 品牌数据库 海事局公示信息数据库 新三板农业企业数据库 联合国粮农组织数据库 环境专业知识服务系统 林业专业知识服务系统 能源专业知识服务系统 渔业专业知识服务系统 农业专业知识服务系统 气象科学专业知识服务系统
以上数据已纳入CCAD2021版,CCAD的全库用户(包括个人用户和机构客户)均将免费获得其云端使用权,其他类型客户请咨询您的专属客服。未来我们将完成更多信息的匹配融合,敬请期待!
注:实际数据量及相关字段以CCAD官网为主!
·END·
星标⭐我们不迷路!
想要文章及时到,文末“在看”少不了!
点击搜索你感兴趣的内容吧
往期推荐