「地图故事」中国县级以上行政区划地名中,哪些字是最常见的?
文/盛光晓
一名精通 ArcPy 的GISer
中国的县级以上行政区划地名共计3100多个,其中包括了县级行政区划的地名、市级行政区划的地名以及省级行政区划的地名。通过统计地名中这些字出现的频率,最终发现出现概率最高的二十个字如下所示。
字 | 频次 |
简要解读
出现概率最高的字是“山”,有没有想到?
“水”,“川”,“海”,“河”,“江”,也都出现在了其中,且总数达到了348个,超过了地名总数的十分之一,很震惊有木有?
“东”,“南”,“西”,“北”中,只有“北”字未出现,而"南"的出现概率最高。
“阳”也高居第三位,显示出了万物生长靠太阳的朴素真理。
“安”,“宁”,“兴”,’‘平’,说明了百姓对于生活的某些期盼,毕竟,平静的生活才是不错的生活,不错的生活就是每天都能睡个安稳觉。
那么,在这个榜单中,你又能领悟出什么独特的东西呢?欢迎在评论区留言啊~
统计数据下载
点击 阅读原文 获取数据下载链接。
统计源码
代码使用Python 编写,使用Python 2.7 运行。
#coding=utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf8')
if __name__ == '__main__':
filepath=r'中国所有县级以上行政区划名称.txt'
f=open(unicode(filepath,'utf8'),'r')
line=str(f.read().replace("'","")).decode('GBK').encode('utf8')
citynames=line.split(',')
count=0
dictWord=dict()
for city in citynames:
city=city.replace('自治县','').replace('自治州','').replace('自治区','').replace('省','').replace('市','').replace('区','').replace('县','').replace('州','').replace('旗','').replace('族','')
for i in range(len(city)/3):
word=city[i*3:(i+1)*3]
if word not in dictWord:
dictWord[word]=0
dictWord[word]+=1
result=sorted(dictWord.items(),key=lambda item:item[1],reverse=True)
for x in range(20):
print result[x][0],result[x][1]
扩展阅读
「图解」ArcGIS 10.6 for Desktop 安装教程(附下载地址)
「图解」ArcGIS 10.4.1 Desktop 完整安装教程(含win7/8/10 32/64位+下载地址+亲测可用)
「解惑」安装ArcGIS License Manager 服务无法启动的解决方案汇总
「分享」 王志强:ArcGIS 10.2操作入门视频教程汇总
「教程」使用ArcGIS(ArcMap)进行简单的缓冲区分析
「视频 」ArcGIS API for JavaScript开发入门教程
「视频」ArcGIS 10.6 for Desktop 安装视频教程
END
关注 麻辣GIS
291616564(QQ群一)
166408035(QQ群二)
627853279(QQ群三)436386604(QQ群四)
http://malagis.com
长按识别二维码关注我们