其他
专题数据 | 真正的商业银行网点面板数据是这样的~~~
引言
最近,团队成员又在朋友圈看到了标题为“商业银行网点数据(1949-2019年)”的数据分享,原始数据来源于银保监会公示平台(http://xkz.cbirc.gov.cn/jr/
)。有些朋友看了“1949-2019年”字样,可能会误以为是面板数据,但事实并非如此。银保监会公示平台仅保留当前在营以及近两年退出的机构信息,因此该分享数据未包含2017年及以前所有已退出机构的信息。
为了与团队自建的中国银行业分支机构历史信息数据库(下文将会详述)作比较,企研数据团队也采集过上述数据。截止到2020年12月14日,银保监会公示平台发布了227378家金融机构信息(其中商业银行及其网点的数量是201812条)。再次强调,这22.7万条数据,只包含抓取数据那个时点上的在营或2年内退出的机构信息。
关注我们!转发本文到朋友圈并附文“免费获取金融许可证信息数据”,保留两小时后添加工作人员企业微信,发送截图,即可免费获取银保监会上采集的22.7万条金融许可证信息数据
然而,从事经济金融方面学术研究的朋友们知道,真正更有学术价值的数据,应该既要包含当前的银行网点数,也要包含各个历史阶段的存量数据,最后结合其他自变量或者因变量,形成真正的面板数据,才能检验各种经济机制或者政策效应。
好消息是,构建中国银行业机构及网点的长面板数据其实还有其他渠道。基于银行业机构正常运营(包括网点)需要在市场监管部门进行登记这一基本事实,企研数据团队已经借助全量(含历史退出)工商登记注册数据构建了中国银行业分支机构历史信息数据库。
正文开始
正文
什么数据有如此魔力?近两年在《经济研究》《金融研究》上频频发文
在《经济研究》《金融研究》这类期刊文章上频繁使用的数据,
那必然像财务、对外投资等数据一样,
复杂、高级、可望而不可即
你们是不是也和小编想法一样,
但,结果出乎意料,备受“宠爱”的竟是——
据不完全统计,2019-2020年《经济研究》《金融研究》上发表的与银行业相关的文章,绝大多数都用到了“银行分支机构数”(见下表)作为原始数据,也是文章计算核心变量的关键数据。
近两年《经济研究》《金融机构》部分银行业相关文章
那么,现在问题来了, 究竟银行分支机构数凭借什么,可以在《经济研究》《金融研究》一流期刊上立足?
小编认为, 除文章本身的idea很赞、有足够的创新外, 最主要是,数据获取整理难度大,耗时耗力 尤其是银行数据,属于微观数据,体量大,而且银行数据暂时无法通过公开渠道直接获取, 银行分支机构数,学者们大多也是从中国银监会的金融许可证网站上手工采集整理。
或许你也想到了可以通过python爬虫获取,轻轻松松,解放双手~~~ 但,大多数学者都是非专业爬虫人士, 学习成本高,花费时间长, 最后,即使结果出来了,数据出错率也是极高的。(因为小编深有感触)
好的文章都始于好的idea
好的文章都基于不断创新
好的文章都成于稳靠的数据
”当你看了大量文献,想到个超棒的idea,创新点也足够
你高兴极了!准备放手一搏,着手采集数据
一个星期,半个月过去了……
结果一言难尽,数据获取竟毫无进展
idea只好暂且搁置
而你的idea可能被人抢先
最后的最后,别人“风光无限”,你却只能“独自哭泣”
如此往复,多少好文章与你擦肩
所以,问问自己,缺的是idea吗?
很多时候大家都有相同的idea,拼的就是时效性,拼的就是数据的获取快慢。
缺的就是好数据呀!!!
企研数据已成功构建出中国银行业分支机构历史信息数据库,包含了基础的工商登记信息以及机构地理信息,囊括了所有银保监会上的字段以及经纬度等信息(具体见下表):
字段 | 银保监会 | 中国银行业分支机构历史信息数据库 |
机构编码 | ✔ | ✔ |
机构名称 | ✔ | ✔ |
机构地址 | ✔ | ✔ |
机构所在地 | ✔ | ✔ |
机构所在地县码 | ✔ | |
邮政编码 | ✔ | ✔ |
发证日期 | ✔ | ✔ |
批准成立日期 | ✔ | ✔ |
发证机关 | ✔ | ✔ |
流水号 | ✔ | ✔ |
机构退出日期 | ✔ | |
注册资金 | ✔ | |
统一社会信用代码 | ✔ | |
经度 | ✔ | |
纬度 | ✔ |
该数据库真正包含了银行业机构包括网点在内的所有历史信息,不仅涵盖了进入时间的信息,也包含了退出时间的信息,因此你可以任意构建自己设想的面板数据,并且我们还提供了机构或者网点的GIS信息,方便进行各种匹配工作。
下表是银监会公开数据和我们构建数据库机构数量的统计结果对照,可以发现国有银行、信用社、农商行、城商行等所有银行业机构在内,合计有46.47万家机构的数据,是前文在营银行业机构数量的两倍还要多,而现存机构数与银保监会公开数据基本吻合,反映了我们所建数据库的准确性是值得信赖的。
机构类型 | 中国银行业分支机构历史信息数据库 | 银保监会 | |||
数据量 | 历史机构数 | 现存机构数 | 数据量 | 现存机构数 | |
国有银行 | 197060 | 6 | 6 | 107053 | 6 |
信用社 | 147814 | 41640 | 1366 | 14679 | 780 |
农村商业银行 | 63544 | 1562 | 1546 | 60696 | 1541 |
城市商业银行 | 22245 | 236 | 139 | 18596 | 134 |
股份制银行 | 18083 | 13 | 13 | 15047 | 13 |
村镇银行 | 6567 | 1646 | 1638 | 6516 | 1637 |
农村合作银行 | 4664 | 117 | 41 | 797 | 27 |
政策性银行 | 2435 | 2 | 2 | 2234 | 2 |
外资银行 | 2107 | 496 | 242 | 947 | 41 |
住房储蓄银行 | 63 | 3 | 1 | 6 | 1 |
农村资金互助社 | 45 | 45 | 42 | 41 | 41 |
开发性金融机构 | 45 | 1 | 1 | 43 | 1 |
民营银行 | 20 | 19 | 19 | 18 | 18 |
银行服务机构 | 7 | 6 | 4 | \ | \ |
合计 | 464692 | 45786 | 5056 | 226673 | 4242 |
注:(1)企研数据“中国银行业分支机构历史信息数据库(V.2021.1)”时间为2021年1月1日,银保监会公开数据时间为2021年02月18日。(2)B列、E列表示含分支机构的全部历史数据,C列表示含退出机构的总行级别机构,D列、F列表示在营的总行级别机构;(3)表中信用社统计数据不一致的原因为银保监存在数据的遗漏;外资银行则是统计口径不一致所导致,企研自建数据库口径大于银保监,包含了代表处、分行、支行等所有在华外资银行。
我们还将银行业机构的人才招聘信息、知识产权信息、公开披露信息一网打尽。并且,企研数据出品的“中国银行业分支机构历史信息数据库”,是由专业人员构思、获取、清洗、维护,数据库不仅信息结构全,而且历史时间完整,并且会在每季度进行更新,以保证数据的实时性。
企研数据
想你所想,为你所想,做你所想
让我们一起
“meet the future”
·END·
星标⭐我们不迷路!
想要文章及时到,文末“在看”少不了!
往期推荐
CCAD_拓展丨食品生产许可获证企业数据库介绍
CCAD_拓展丨农村金融机构及其分支机构地理信息等 — —《经济研究》等权威期刊文献均在使用!
CCAD_拓展丨全国农产品批发市场价格全量数据
CCAD_拓展丨全国排污许可证登记信息公开数据
CCAD丨能支撑国家社科2021年度三农领域的哪些选题?
文丨许晨媛 杨奇明
审核 | 杨奇明
排版编辑丨青酱