查看原文
其他

Python编程技术暑期训练营报名啦!

爬虫俱乐部 Stata and Python数据分析 2022-03-15

爬虫俱乐部Python编程技术暑期训练营开班啦!

爬虫俱乐部将于2019年7月5日至7月8日在武汉举行首期Python编程技术定制培训。本次培训采用理论与案例相结合的方式,旨在帮助零基础学员轻松入门Python,由浅入深学习和掌握Python爬虫技术,并明确未来更进一步的学习方向。课程分为四天,第一天作为入门,带领学员迅速了解Python的原生语法规则与代码规范,学会使用Python做基本的程序处理,第二天将主要介绍当下最主流的Python数据处理库pandas,第三天是爬虫知识与案例解析,我们将以案例为主,介绍与爬虫相关的各类知识与技能,第四天将教授基于Selenium模拟登陆的爬虫案例以及爬虫数据处理。

爬虫俱乐部已多次举办线下Stata培训活动,曾经在武汉大学、华中科技大学、中央财经大学、中南财经政法大学、华中农业大学、西南财经大学、郑州大学、河南大学、福州大学、长沙理工大学、湖北大学和湖北经济学院等进行师资和研究生实证方法的培训,好评如潮。爬虫俱乐部的公开培训也进行了十几场,场场爆满座无虚席。在爬虫俱乐部的各位粉丝和往期学员的殷切期盼下,爬虫俱乐部重磅推出Python编程技术培训。

在针对市面上现有的Python线下课程进行了调研评估后,爬虫俱乐部精心编制了此次课程,内容包含当前主流的数据处理与网络爬虫技术,无一遗漏。课程全程以案例为纲,又辅以知识图谱文档,保证趣味性的同时兼顾知识的全面。同时为了最大程度保证教学效果,课程安排了相当部分的练习时间与助教答疑。课程的初衷是通过短期的课程,可以使学员迅速掌握爬虫的基本技术与知识背景,可以独立自主地开发爬虫为自身研究服务。


培训内容

 0. 认识Python与学习的方法论
  • Python的简介、优势与应用前景

  • Python在数据处理与爬虫上的优势

  • Python环境安装与脚本运行

  • 第一个Python程序

  • 我们应当如何高效地学习Python爬虫

1. Python:基础知识与操作
  • 变量类型与应用

    整型、浮点型、字符串、列表、字典与元组

  • 文件的读、写与保存(open函数、pickle)

  • 列表与字典的应用场景(以CSSCI目录期刊整理为例)

    ① pop

    ② append

    ③ remove

    ④ items

  • 流程控制方法

    ① for 与 while

    ② if

    ③ break 与 continue

    ④ try 与 except

  • Python第三方库的了解与使用

    xlrd与pyecharts(地区污染数据的excel读取与数据可视化)

2. Python数据处理:pandas

  • 数据的读入与定义

    read_excel、read_stata及read_csv

  • 数据的基本处理(以中国城市统计年鉴处理为例)

    ① 数据的查看、修改与删除

    ② 数据排序

    ③ 缺失值的处理

    ④ 重复值的去重(duplicates)

    ⑤ 数据筛选

 ⑥ 字符型变量的处理(匹配、替换、切割、提取)

  • 数据的导出

    csv、dta、xls(to_excel、to_stata及to_csv)

  • 数据集的合并连接(以分析师指标计算为例)

    ① merge

    ② concat

    ③ append

  • 简单图形的绘制(pyecharts数据可视化)

   3. Python爬虫:request爬虫

  • 服务器请求原理与爬虫的本质工作

  • 爬虫初步:国家社科基金网站爬取(get方式)

  • 爬虫伪装:自定义headers头部信息

  • post型请求页面(以和讯网基金经理人信息抓取为例)

   4. Selenium模拟登录

  • 当前业界反爬措施的总介绍

  • 使用Selenium抓取天眼查数据

  • Selenium爬虫的代码理念与爬虫的工程控制

 5. 爬虫数据处理

  • html文件树概念

  • 网页信息解析库:beautifulsoup

  • 更强大的工具:Xpath与正则表达式

  • 案例实训:一个完整的Python爬虫


培训目的

     本次培训通过具体的案例对每部分技术进行讲解,力图使大家掌握Python的基本命令、编程、数据处理以及抓取网络数据的方法。专题式的讲解使你能在短时间内掌握Python的精髓,精选的实例和翔实的配套资料能让你在课后快速拓展所学,为进一步学习和科研打下扎实的基础。


 培训对象

国内高校教师、硕士生、博士生、科研院所科研人员、社会团体及网络爬虫技术爱好者。


 报名方式

即日起扫描下方二维码点击文末阅读原文获得报名表提交报名信息,发送“Python报名表+支付截图”至邮箱:statatraining@163.com,邮件主题为:“爬虫俱乐部2019Python暑期培训+姓名+单位”。


 报名费用及优惠

2400元/每人(含报名费、培训费,食宿自理)


 支付方式

      对公转账

开户名:武汉字符串数据科技有限公司

开户行:中国银行股份有限公司武汉中南财经政法大学分理处

对公账号:579473738265

      对私转账

王悦 13665513855


 相关单位

主办方:武汉字符串数据科技有限公司、爬虫俱乐部


 其他事项及培训安排

  • 请学员自带笔记本电脑。

  • 本次培训食宿及往返交通费用学员自理。

  • 即日起开始正式报名和收费。


 培训时间地点

时间:2019.7.5-2019.7.8(请提前一天报道)

地点:湖北-武汉


 联系方式

联系人:王悦

QQ:453572056

微信:453572056

手机:13665513855

邮箱:wycs_2020@163.com

对爬虫俱乐部的推文累计打赏超过1000元我们即可给您开具发票,发票类别为“咨询费”。用心做事,只为做您更贴心的小爬虫!

往期推文推荐

关于我们

微信公众号“爬虫俱乐部”分享实用的stata命令,欢迎转载、打赏。爬虫俱乐部是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。

此外,欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。

投稿邮箱:statatraining@163.com

投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到关于stata分析数据的问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存