其他
更新|金融机构网点信息、经纬度和所处省市区县分布数据(含已退出的金融机构网点)
之前的数据只包含了持有列表,没有包含已退出的。这次更新后的数据包含了持有列表 + 已退出的,合计 233918 条数据。另外上次的数据不包含金融机构网点的详情数据,这次的数据也添加上了。
今天给大家分享一份金融机构网点数据,为了方便大家的使用,我使用百度地图地理编码接口为每个机构解析了经纬度信息以及使用地理计算根据经纬度生成了所处省市区县信息。数据来自中国银行保险监督管理委员会,整理时间为 2021 年 12 月 06 日。
数据包含机构持有列表和机构退出列表,合计 233918 条数据。提供如下两种格式的:
供 Excel 打开的 xlsx 文件; 供 Stata 读取的 dta 文件。
包含如下变量:
编号 证件流水号 机构编码 机构名称 机构简称 英文名称 批准成立日期 发证日期 发证机关 机构地址 机构所在地 邮政编码 经营范围 变更前机构信息_机构编码 变更前机构信息_机构地址 变更前机构信息_机构名称 变更前机构信息_流水号 退出日期(已退出的机构有这个变量的信息) 经度(根据百度地图地理编码接口解析,已转换成 WGS84 坐标系) 纬度(根据百度地图地理编码接口解析,已转换成 WGS84 坐标系) 是否精确查找(下面有说明) 绝对精度(下面有说明) 地址理解程度(下面有说明) 地址类型(下面有说明) 省 / 省代码 / 省类型(根据经纬度和2020年行政区划计算得到) 市 / 市代码 / 市类型(根据经纬度和2020年行政区划计算得到) 县 / 县代码 / 县类型(根据经纬度和2020年行政区划计算得到)
地理分布
下图展示了这 23 万家金融机构的地理分布:
与之前的数据不同,这次经纬度解析使用的是百度地图地理编码接口。使用百度地图地理编码接口的好处在于它除了经纬度还会提供准确度指标,也就是上面的是否精确查找、绝对精度、地址理解程度和地址类型指标:
是否精确查找:1为精确查找,即准确打点;0为不精确,即模糊打点。 绝对精度:描述打点绝对精度(即坐标点的误差范围)。
confidence=100,解析误差绝对精度小于20m; confidence≥90,解析误差绝对精度小于50m; confidence≥80,解析误差绝对精度小于100m; confidence≥75,解析误差绝对精度小于200m; confidence≥70,解析误差绝对精度小于300m; confidence≥60,解析误差绝对精度小于500m; confidence≥50,解析误差绝对精度小于1000m; confidence≥40,解析误差绝对精度小于2000m; confidence≥30,解析误差绝对精度小于5000m; confidence≥25,解析误差绝对精度小于8000m; confidence≥20,解析误差绝对精度小于10000m;
comprehension=100,解析误差100m内概率为91%,误差500m内概率为96%; comprehension≥90,解析误差100m内概率为89%,误差500m内概率为96%; comprehension≥80,解析误差100m内概率为88%,误差500m内概率为95%; comprehension≥70,解析误差100m内概率为84%,误差500m内概率为93%; comprehension≥60,解析误差100m内概率为81%,误差500m内概率为91%; comprehension≥50,解析误差100m内概率为79%,误差500m内概率为90%;
因此这次大家可以根据这四个指标判断解析得到的经纬度的准确性。
各区县金融机构网点的数量
数据中的省市区县是根据经纬度解析的(由于经纬度解析可能存在错误,所以这些省市区县也可能存着错误),为了方便大家使用,我汇总了每个省市区县的金融机构数量。
获取数据
是不是感觉很硬核!欢迎报名 RStata 培训班获取全部课程和以会员价获取数据资料(10元/份)详情可阅读这篇推文:数据处理、图表绘制、效率分析与计量经济学如何学习~
详情可点击阅读原文进入 RStata 学院了解(从首页的会员卡专区即可查看和购买会员卡)。
更多关于 RStata 培训班的信息可添加微信号 r_stata 咨询: