其他
定位神器——cngcode
本文作者:方 言
文字编辑:李婷婷
技术总编:余术玲
爬虫俱乐部云端课程
1、安装
2、申请密钥
控制台
:3、语法
province(varname) 指定包含省名称的字符串变量。
city(varname) 指定包含城市名称的字符串变量。
district(varname) 指定包含地区名称的字符串变量。
address(varname) 指定包含地址的字符串变量。
fulladdress(varname) 指定包含完整地址的字符串变量。
latitude(newvar) 指定包含纬度的变量名称,则需要纬度。
longitude(newvar) 指定包含经度的变量名称,则需要使用经度。
ffirst 如果从组合地址得到的位置与从完整地址返回的位置不同,则ffirst首先指定来自完整地址的位置。
4、定义中文地址
clear
set more off
input str10 prov str10 city str10 dist str60 addr
"湖北省" "武汉市" "" "金银潭医院"
"四川省" "" "" "华西医院"
"" "北京市" "" "协和医院"
end
cngcode, baidukey(输入你的百度密钥) province(prov) city(city) district(dist) address(addr) lat(startlat) long(startlng)
list
clear
set more off
input str60 fulladdr
"湖北省武汉市金银潭医院"
"四川省华西医院"
"北京市协和医院"
end
cngcode, baidukey(输入你的百度密钥) fulladdress(fulladdr) lat(startlat) long(startlng)
list
clear
set more off
input str10 prov str10 city str10 dist str60 addr str80 fulladdr
"湖南省" "长沙市" "" "中南大学" "湖北省武汉市南湖大道中南财经政法大学"
end
cngcode, baidukey(输入你的百度密钥) province(prov) city(city) district(dist) address(addr) fulladdress(fulladdr) lat(startlat) long(startlng)
list
clear all
cap mkdir D:\财务金融\上市公司地址
cd D:\财务金融\上市公司地址
mkf address stkcd strL address
cnstock all
sample 10,count
levelsof stkcd, local(stkcd)
foreach stk in `stkcd' {
local stk: disp %06.0f `stk'
cap copy "http://vip.stock.finance.sina.com.cn/corp/go.php/vCI_CorpInfo/stockid/`stk'.phtml" temp.txt, replace
while _rc != 0 {
sleep 1000
cap copy "http://vip.stock.finance.sina.com.cn/corp/go.php/vCI_CorpInfo/stockid/`stk'.phtml" temp.txt, replace
}
infix strL v 1-100000 using temp.txt, clear
replace v = ustrfrom(v, "gb18030", 1)
keep if index(v[_n-1], `"<td class="ct">办公地址:</td>"')
replace v = ustrregexra(v, "<.*?>", "")
frame post address (`stk') (v[1])
}
cwf address
format %06.0f stkcd
cngcode, baidukey(输入你的百度密钥) lat(startlat) long(startlng) fulladdress(address)
追踪命令set trace on——解你燃眉之急
爬虫大杀器 | “手把手”教你配置Selenium
小白必看!Anaconda安装全攻略
用WordStat看中国日报新闻(二)
一招轻松合并文件——openall命令介绍
微信公众号“Stata and Python数据分析”分享实用的stata、python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。