查看原文
其他

Stata&Python网络课程涨价声明

爬虫俱乐部 Stata and Python数据分析 2023-01-01


Stata&Python云端课程来啦!

为了平衡团队运营成本,维系公众号的运营,也与国内动辄数千元的Stata课程缩短差距,我们的网课不得不上调价格,我们决定于2022年5月15日起调价,Python课程的价格调整为439.9元Stata基础课程调为439.9元Stata进阶课程调整到439.9元。大家可以告知一下身边想要购买的小伙伴,欲购从速哦,对报名有任何疑问欢迎在公众号后台和腾讯课堂留言~我们在这篇推文提供了每门课程的课程二维码,大家有需要的话可以直接扫描二维码查看课程详情并进行购买哦~



团队介绍

爬虫俱乐部是由中南财经政法大学李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队,团队已面向教师和研究生多次举办Stata和Python的编程课程,曾经在厦门大学、武汉大学、华中科技大学、中央财经大学、中南财经政法大学、华中农业大学、西南财经大学、西南政法大学、郑州大学、河南大学、华侨大学、华东政法大学、广东外语外贸大学、福州大学、长沙理工大学、广西大学、石河子大学、新疆财经大学、云南财经大学和湖北大学等多所高校进行培训,得到学员的一致好评。

课程特色

  1. 爬虫俱乐部课程采用理论与案例相结合的方式,根据具体的数据案例(如上市公司高管任职信息和公告抓取、判案文书高频词提取、 港股交易数据抓取、企查查企业工商信息抓取、高频词词云图绘制、判案文书情感词汇提取、判案文书语调指标计算等)去帮助同学们理解基础知识和方法的理解,形成完整的理论框架。

  2. 爬虫俱乐部的课程设置由浅入深,即便是针对于初学者也能轻松容易地上手进行实际操作,不需要高深的数学和计量基础也能学会!

  3. 学完爬虫俱乐部课程后可以帮助大家解决实证分析中最关键的问题,即数据的获取、清洗、输出等问题,助力大家进行实证研究!

  4. 爬虫俱乐部课程的所有代码和案例数据在报名课程后,可直接在课程详情下载,方便同学们课后复习。

  5. 报名爬虫俱乐部课程的同学,均可进入课程答疑群,不仅有负责人会为你耐心细致地解答问题,还有群内红包福利哦!


课程评价

爬虫俱乐部的课程深受同学们的喜爱,大家都表示通过这门课不仅让自己形成了较完整的知识框架,也系统提高了自己的数据分析能力!




课程大纲

Stata基础培训大纲

1

基本命令

第一节 课程大纲简介

第二节 Stata界面介绍

第三节 寻求帮助

第四节 Stata 返回值

第五节 Stata的Dos命令

第六节 数据读入

第七节 数据读入实例—CSSCI

第八节 数据读入实例—多个Sheet的读入

第九节 数据读入实例—基金经理

2

基本命令第二部分

第一节 循环

第二节 多框架系统简介

第三节 多框架系统实例—火车

第四节 多框架系统实例—同步性

第五节 多框架系统实例—找朋友

3

结果输出

第一节  结果输出-Putdocx(1)-基础

第二节  结果输出-Putdocx(2)-汉字案例

第三节  结果输出-Putdocx(3)-豆瓣电影

第四节  结果输出-实证结果输出

4

网络数据

第一节  爬虫(1)--单页公告标题

第二节  爬虫(2)--多页公告标题

第三节  爬虫(3)--公告内容

第四节  爬虫(4)--高管任职

第五节  爬虫(5)--高管个人简历

第六节  爬虫(6)--CSSCI期刊目录

第七节  爬虫(7)--PDF表格提取

第八节  爬虫(8)--PDF文本提取

第九节  爬虫(9)--深交所评级

第十节  爬虫(10)--港股交易数据



Stata进阶培训大纲

1

基本字符串函数及其应用

第一节 公司治理主要指标获取

1.抓取上市公司高管信息案例

2.如何找到上市公司的董事长

3.如何找到上市公司的总经理

4.获取大股东信息

5.审计信息

6.分析师跟踪信息

7.构建G-index

8.樊纲指数与公司信息合并

第二节 公司的文化环境构建

1.获得上市公司的办公地址

2.办公地址转化为经纬度

3.获得周边5公里范围内的佛教寺院列表

4.获得周边5公里范围内的道教、基督教等宗教场所列表

5.获得周边5公里范围内的咖啡馆列表

6.上市公司到以上场所的交通距离和交通时间(步行、公交、驾车等线路)

2

正则表达式及其应用

第一节 正则表达式基本函数介绍

1.ustrregexm()

2.ustrregexs()

3.ustrregexrf()与ustrregexra()

第二节 正则表达式元字符介绍

1.基本元字符

2.数量元字符

3.位置元字符

4.前后查找

5.特殊字符元字符

6.回溯引用

7.unicode编码

第三节 正则表达式匹配模式

1.贪婪模式

2.懒惰模式

第四节 正则表达式例子

1.邮编提取

2.城市名称提取

3.英文姓名的拆分

4.用正则表达式提取日期

5.北大法宝裁判文书信息提取

第五节 正则表达式相关命令

1.moss命令与简单的词频统计

3

网络爬虫

第一节 上市公司诉讼仲裁信息抓取

第二节 全国律师事务所名录抓取

第三节 二次爬虫:深圳律师名录抓取

第四节 Json的处理:司法部法律法规规章抓取

第五节 pdf及word文档信息提取

1.深交所融资融券标的公司提取

2.裁判文书文本内容提取

4

判案文书的文本分析

第一节 分词的基本原理

第二节 分词的实现

1.自定义分词

2.Stata自身分词系统

3.Stata与python交互分词

第三节 图形可视化

1.判案文书高频词提取

2.高频词词云图绘制

3.重点词汇的高亮输出

第四节 情感分析

1. 判案文书情感词汇提取

2.计算判案文书语调指标

3.基于百度AIP计算情感倾向


Python培训大纲

1

基础梳理

第一节 导论

1. Python的历史、应用前景与优势

2. Python开发环境简介、程序实操

3. 如何学习、获取帮助

第二节 基础入门

1. 常用数据类型

2. 算法

第三节 文件操作与数据处理   

第四节 标准库与第三方库简介

2

科学计算

第一节 NumPy, Pandas介绍

第二节 数据引入

1.随机模拟+数据存储

2.不同格式数据读入

第三节 数据常见处理

1.缺失值处理

2.数据合并、连接

3.长宽格式转换

第四节 数据基本分析

1.数据的基本统计分析

2.数据透视、分组分析

3.相关性分析、线性回归

3

网络爬虫

第一节 XPath

1.路径表达式

2.XPath运算符

3.Chrome浏览器与XPath Helper插件使用

第二节 使用XPath提取网页信息

1.新浪财经上市公司高管任职数据的抓取

2.新浪财经上市公司公告数据抓取

第三节 jsonpath提取网页信息

1.深交所信息披露考评数据

第四节 GET请求方式与POST请求方式

1.港股历史交易数据的获取

第五节 selenium

1.企查查企业工商信息抓取




相关单位

主办方:武汉字符串数据科技有限公司

                                         爬虫俱乐部

爬虫俱乐部的课程均可开具发票。如需要的学员,请务必购买前联系相关课程负责人。Stata课程开具发票添加课程负责人微信:liuadaihaoren。Python课程联系课程负责人微信:lhz60999。


关于我们 


   微信公众号“Stata and Python数据分析”分享实用的Stata、Python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。

   武汉字符串数据科技有限公司一直为广大用户提供数据采集和分析的服务工作,如果您有这方面的需求,请发邮件到statatraining@163.com,或者直接联系我们的数据中台总工程司海涛先生,电话:18203668525,wechat: super4ht。海涛先生曾长期在香港大学从事研究工作,现为知名985大学的博士生,爬虫俱乐部网络爬虫技术和正则表达式的课程负责人。



此外,欢迎大家踊跃投稿,介绍一些关于Stata和Python的数据处理和分析技巧。

投稿邮箱:statatraining@163.com投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里
为作者署名,并有赏金分成。

2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众
号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存