爬虫俱乐部平安经
本文作者:王玉婷、方言、赵冰洁、李婷婷、任哲、王子一、戴雯、陈丹慧
文字编辑:李婷婷
技术总编:余术玲
Stata云端培训课程在腾讯课堂上线啦!
爬虫俱乐部于2020年7月中旬在线上举行的Stata编程技术培训课程在腾讯课堂上线啦!课程通过案例教学模式,帮助学员在短期内掌握Stata的基本命令、编程、数据处理以及结果输出等技术,并对Stata16的实用新功能做了详细介绍。
现在关注公众号并在朋友圈转发推文,即可获得600元课程优惠券,集赞50个再领200元课程优惠!(截图发至本公众号后台领取)原价2400元的课程,现在只要1600元!
爬虫俱乐部将于2020年8月25日至28日在线上举行Stata数据分析法律与制度专题训练营,主要是为了让学员掌握Stata软件进阶操作,涉及内容包括基本字符串函数及其应用、正则表达式、法律与制度数据网络爬虫技巧、判案文书的文本分析等技术。课程全部采用最新版Stata16软件(提供Stata16试用版, 试用期一个月)进行教学,课程通过案例教学模式,专题式的讲解使你能在短时间内掌握Stata的精髓,精选的实例和详实的配套资料能让你在课后快速拓展所学,并能够编写一些实用的Stata程序,为进一步学习和科研打下扎实的基础。同时,此次云端课程提供线上答疑。详情请参考《8月Stata数据分析法律与制度专场来啦!》
各地粉丝平安
上海2652位粉丝平安,东瀛248位粉丝平安,中华人民共和国台湾省62位粉丝平安,云南省521位粉丝平安,内蒙古自治区357位粉丝平安,北京3512位粉丝平安,吉林省274位粉丝平安,四川省2266位粉丝平安,大不列颠及北爱尔兰联合王国265位粉丝平安,天津699位粉丝平安,宁夏99位粉丝平安,安徽省1638位粉丝平安,山东省2466位粉丝平安,山西省922位粉丝平安,广东省4793位粉丝平安,广西壮族自治区753位粉丝平安,德意志联邦198位粉丝平安,战斗民族298位粉丝平安,新疆维吾尔族自治区427位粉丝平安,朝鲜半岛南部174位粉丝平安,枫叶国179位粉丝平安,江苏省2499位粉丝平安,江西省1310位粉丝平安,河北省1141位粉丝平安,河南省3595位粉丝平安,法兰西共和国208位粉丝平安,浙江省2335位粉丝平安,海南省194位粉丝平安,湖北省3091位粉丝平安,湖南省1369位粉丝平安,澳门特别行政区17位粉丝平安,甘肃省680位粉丝平安,福建省1229位粉丝平安,美利坚合众国1090位粉丝平安,西藏自治区19位粉丝平安,贵州省375位粉丝平安,辽宁省805位粉丝平安,重庆912位粉丝平安,陕西省1145位粉丝平安,青海省51位粉丝平安,香港特别行政区254位粉丝平安,黑龙江省375位粉丝平安。
addbefore平安,cnaddress平安,chinafin平安,cngcode平安,cnar平安,cnintraday平安,cnstock平安,cntop10平安,cntrade平安,cntraveltime平安,corr2docx平安,eventstudy平安,psemail平安,reg2docx平安,subinfile平安,sum2docx平安,t2docx平安,ttable2平安,wordconvert平安。
clear all
cap mkdir d:/Stata16/爬虫俱乐部平安经
cd d:/Stata16/爬虫俱乐部平安经
use 平安经1.dta,clear
foreach v of var*{
local a=1
! taskkill /F /IM WINWORD.EXE /T
putdocx begin,pagesize(A4)
putdocx paragraph,font("宋体",18,black) halign(left)
putdocx text ("`v'平安"), bold
levelsof `v',local(p)
putdocx paragraph,font("宋体",16,black) halign(left) indent(para,0.5)
foreach t in `p'{
if `a'<`r(N)' putdocx text ("`t'平安,")
else putdocx text ("`t'平安。")
local a=`a'+1
}
putdocx save "平安经`v'.docx",replace
}
clear all
putdocx begin,pagesize(A4)
putdocx paragraph,font("宋体",16,black) halign(left) indent(para,0.5)
putdocx text ("最后,祝最近遭受暴雨的各省市人民平安,祝本文所有作者平安,祝所有读者平安!")
putdocx save "平安经祝福.docx",replace
putdocx append "平安经各地粉丝.docx" "平安经命令.docx" "平安经曾授课的院校.docx" "平安经各项工作.docx" "平安经在香港工作的小盆友.docx" "平安经爬虫俱乐部成员.docx" "平安经毕业生.docx" "平安经祝福.docx",saving("平安经.docx",replace)
shellout "平安经.docx"
由于我们要将所有的内容后面都加上平安,因此我们需要通过foreach循环来进行遍历。这里涉及到的是foreach的一个用法:
foreach lname of list {
commands referring to `lname'
}
这里的lname表示循环算子,list是我们需要进行遍历的变量列表。在foreach中如果要遍历所有变量,需要用of进行连接。
在循环中我们可以设置需要输出内容的相关格式,这里就需要用到我们强大putdocx命令,该命令允许将各种文本、格式化的图表,甚至是图片等交由Stata自动输出为.docx文件。下面我们来分析一下程序:
(1)为防止内存中存在尚未关闭的word文档而导致程序报错,我们首先需要清空内存,用taskkill命令关闭所有打开的word文件。
! taskkill /F /IM WINWORD.EXE /T
(2)创建新的.docx文件,并将其设置成A4纸张的格式。
putdocx begin,pagesize(A4)
(3)要想输出成平安经里的效果,必须用putdocx paragraph先生成段落并设置好每段的标题以及内容的格式。
putdocx paragraph,font(“宋体”,18,black) halign(left) //这里我们将每个段落的标题格式设置为黑色18号宋体,并实现左对齐。
在输入完每个段落的标题之后,我们将输入每个段落标题的具体内容。这里的v表示的是foreach中的循环算子:
putdocx text ("`v'平安"), bold
其次,我们要输入每个段落具体的内容和格式。
putdocx paragraph,font(“宋体”,16,black) halign(left) indent(para,0.5) //这里我们将每个段落的格式设置为黑色16号宋体,并实现左对齐以及首行缩进的效果
我们要把以上输入的这段文字保存在.docx文件里面,这时候需要用到命令putdocx save。
putdocx save "平安经`v'.docx",replace
(4)最后我们将每个文件进行合并并输出到docx文档中。
putdocx append "平安经各地粉丝.docx" "平安经命令.docx" "平安经曾授课的院校.docx" "平安经各项工作.docx" "平安经在香港工作的小盆友.docx" "平安经爬虫俱乐部成员.docx" "平安经毕业生.docx" "平安经祝福.docx",saving("平安经.docx",replace)
shellout "平安经.docx"
高校经管类核心期刊发文排行榜|2010-2019
PDF文本信息提取(二)
关于我们
微信公众号“Stata and Python数据分析”分享实用的stata、python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。