查看原文
其他

Stata&Python云端课程来啦!

爬虫俱乐部 Stata and Python数据分析 2022-03-15


Stata&Python云端课程来啦!

为了平衡团队运营成本,维系公众号的运营,也与国内动辄数千元的Stata课程缩短差距,我们的网课不得不上调价格,我们决定于11月1日起调价,Python课程的价格调整为249.9元Stata进阶课程调为249.9元Stata基础课程调整到299.9元。大家可以告知一下身边想要购买的小伙伴,欲购从速哦,对报名有任何疑问欢迎在公众号后台和腾讯课堂留言~我们在这篇推文提供了每门课程的课程二维码,大家有需要的话可以直接扫描二维码查看课程详情并进行购买哦~


团队介绍

爬虫俱乐部是由中南财经政法大学李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队,团队已面向教师和研究生多次举办Stata和Python的编程课程,曾经在厦门大学、武汉大学、华中科技大学、中央财经大学、中南财经政法大学、华中农业大学、西南财经大学、西南政法大学、郑州大学、河南大学、华侨大学、华东政法大学、广东外语外贸大学、福州大学、长沙理工大学、广西大学、石河子大学、新疆财经大学、云南财经大学和湖北大学等多所高校进行培训,得到学员的一致好评。

课程特色

  1. 爬虫俱乐部课程采用理论与案例相结合的方式,根据具体的数据案例(如上市公司高管任职信息和公告抓取、判案文书高频词提取、 港股交易数据抓取、企查查企业工商信息抓取、高频词词云图绘制、判案文书情感词汇提取、判案文书语调指标计算等)去帮助同学们理解基础知识和方法的理解,形成完整的理论框架

  2. 爬虫俱乐部的课程设置由浅入深,即便是针对于初学者也能轻松容易地上手进行实际操作,不需要高深的数学和计量基础也能学会!

  3. 学完爬虫俱乐部课程后可以帮助大家解决实证分析中最关键的问题,即数据的获取、清洗、输出等问题,助力大家进行实证研究!

  4. 爬虫俱乐部课程的所有代码和案例数据在报名课程后,可直接在课程详情下载,方便同学们课后复习。

  5. 报名爬虫俱乐部课程的同学,均可进入课程答疑群,不仅有负责人会为你耐心细致地解答问题,还有群内红包福利哦!



课程评价

爬虫俱乐部的课程深受同学们的喜爱,大家都表示通过这门课不仅让自己形成了较完整的知识框架,也系统提高了自己的数据分析能力!




课程大纲

Stata基础培训大纲

1

数据读入与Stata16的多框架系统

1)  熟悉界面

2)  多框架系统的基本原理

3)  寻求帮助(在线帮助、搜索帮助等)

4)  常用命令

5)  常用函数

6)  不同格式文件读入

7)  Wind交易数据整理案例

8)  基金经理变更数据整理案例

2

宏与循环

1)  local、global、宏扩展函数

2)  while、foreach、forvalue循环

3)  批量处理文件与变量

4)  NBER工作论文下载案例

5)  上交所年报抓取综合案例

6)  新浪财经公告信息抓取案例

7)  CSMAR交易和财务数据整理案例

3

数据库操作

1)  数据的纵向合并、横向合并与长宽变换

2)  常用命令

3)  Wind财务数据整理案例

4)  美国流行歌曲目录整理案例

5)  起死回生命令(preserve与restore)

6)  CSSCI期刊目录整理案例

7)  label、labelsof介绍

8)  字符串处理(关键词、替换、提取等)

4

Post命令

1)  Stata16之前的post命令工作原理

2)  定义post——找朋友的案例

3)  用post计算股价同步性和Beta

4)  基于网络数据的事件研究

5)  股本变更数据整理案例

6)  Frame post的使用

5

回归分析及结果输出

1)  putdocx命令输出内容至word文档

2)  putdocx命令相关案例

3)  实证结果输出

6

网络数据

1)  上市公司公告的抓取

2)  上市公司高管任职信息抓取

3)pdf表格提取

4)pdf文本提取

5)  深交所信息披露考评数据抓取

6)  港股交易数据抓取

Stata进阶培训大纲

1

基本字符串函数及其应用

第一节 公司治理主要指标获取

1.抓取上市公司高管信息案例

2.如何找到上市公司的董事长

3.如何找到上市公司的总经理

4.获取大股东信息

5.审计信息

6.分析师跟踪信息

7.构建G-index

8.樊纲指数与公司信息合并

第二节 公司的文化环境构建

1.获得上市公司的办公地址

2.办公地址转化为经纬度

3.获得周边5公里范围内的佛教寺院列表

4.获得周边5公里范围内的道教、基督教等宗教场所列表

5.获得周边5公里范围内的咖啡馆列表

6.上市公司到以上场所的交通距离和交通时间(步行、公交、驾车等线路)

2

正则表达式及其应用

第一节 正则表达式基本函数介绍

1.ustrregexm()

2.ustrregexs()

3.ustrregexrf()与ustrregexra()

第二节 正则表达式元字符介绍

1.基本元字符

2.数量元字符

3.位置元字符

4.前后查找

5.特殊字符元字符

6.回溯引用

7.unicode编码

第三节 正则表达式匹配模式

1.贪婪模式

2.懒惰模式

第四节 正则表达式例子

1.邮编提取

2.城市名称提取

3.英文姓名的拆分

4.用正则表达式提取日期

5.北大法宝裁判文书信息提取

第5节 正则表达式相关命令

1.moss命令与简单的词频统计

3

网络爬虫

第一节 上市公司诉讼仲裁信息抓取

第二节  全国律师事务所名录抓取

第三节  二次爬虫:深圳律师名录抓取

第四节 Json的处理:司法部法律法规规章抓取

第五节 pdf及word文档信息提取

1.深交所融资融券标的公司提取

2.裁判文书文本内容提取

4

判案文书的文本分析

第一节 分词的基本原理

第二节 分词的实现

1.自定义分词

2.Stata自身分词系统

3.Stata与python交互分词

第三节 图形可视化

1.判案文书高频词提取

2.高频词词云图绘制

3.重点词汇的高亮输出

第四节 情感分析

1. 判案文书情感词汇提取

2.计算判案文书语调指标

3.基于百度AIP计算情感倾向




Python培训大纲

1

基础梳理

第一节 导论

1. Python的历史、应用前景与优势        

2. Python开发环境简介、程序实操

3. 如何学习、获取帮助

第二节 基础入门

1. 常用数据类型

2. 算法

第三节 文件操作与数据处理   

第四节 标准库与第三方库简介

2

科学计算

第一节 NumPy, Pandas介绍

第二节 数据引入

1.随机模拟+数据存储

2.不同格式数据读入

第三节 数据常见处理

1.缺失值处理

2.数据合并、连接

3.长宽格式转换

第四节 数据基本分析

1.数据的基本统计分析

2.数据透视、分组分析

3.相关性分析、线性回归

3

网络爬虫

第一节 XPath

1.路径表达式

2.XPath运算符

3.Chrome浏览器与XPath Helper插件使用

第二节 使用XPath提取网页信息

1.新浪财经上市公司高管任职数据的抓取

2.新浪财经上市公司公告数据抓取

第三节 jsonpath提取网页信息

1.深交所信息披露考评数据

第四节 GET请求方式与POST请求方式

1.港股历史交易数据的获取

第五节 selenium

1.企查查企业工商信息抓取



相关单位

主办方:武汉字符串数据科技有限公司

              爬虫俱乐部


关于我们 


   微信公众号“Stata and Python数据分析”分享实用的Stata、Python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。

   武汉字符串数据科技有限公司一直为广大用户提供数据采集和分析的服务工作,如果您有这方面的需求,请发邮件到statatraining@163.com,或者直接联系我们的数据中台总工程司海涛先生,电话:18203668525,wechat: super4ht。海涛先生曾长期在香港大学从事研究工作,现为知名985大学的博士生,爬虫俱乐部网络爬虫技术和正则表达式的课程负责人。



此外,欢迎大家踊跃投稿,介绍一些关于Stata和Python的数据处理和分析技巧。

投稿邮箱:statatraining@163.com投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里
为作者署名,并有赏金分成。

2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众
号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存