爬虫俱乐部2019十一Python编程技术培训报名啦!
2019年8月22日至28日Stata培训高级班招生已经结束,初级班尚有几个名额,请有兴趣的同学抓紧时间报名哦!同时请大家继续关注我们的公众号,留意下一期的Stata课程哦!
爬虫俱乐部将于2019年10月2日至10月5日在武汉举行Python编程技术培训。本次培训采用理论与案例相结合的方式,旨在帮助零基础学员轻松入门Python,由浅入深学习和掌握Python的编程技术,特别是爬虫技术和文本分析技术。本课程共四天,第一天是Python编程入门,带领学员迅速了解Python的原生语法规则、Jupyter编程环境与代码规范,使得学员能使用Python编写和执行最基本的程序;第二天将介绍简单的Python爬虫技术,深入了解HTTP协议、HTML语言、BeautifulSoup和Requests等Python第三方库的运用;第三天将学习基于selenium模拟登陆的爬虫案例以及爬虫数据处理;第四天学习使用Python进行文本分析。
爬虫俱乐部已多次举办Stata或Python的编程课程,也曾经在武汉大学、华中科技大学、中央财经大学、华中农业大学、西南财经大学、西南政法大学、郑州大学、河南大学、福州大学、长沙理工大学、广西大学、石河子大学、新疆财经大学和湖北大学等进行针对教师和研究生的实证方法培训。爬虫俱乐部的公开培训也进行了十几场。
2019年7月,爬虫俱乐部的“首期Python编程技术培训”圆满结束,课程赢得了广大学员的一致好评,大家纷纷表示通过这次培训学习到了Python相关知识和技巧,受益匪浅。我们在课程期间和课程以后,均对我们的学员提供了长期的答疑解惑和技术支持。因为我们采取的是严格的小班教学,导致后期有很多学员因为人数限制而没有办法报名参加第一期的Python培训。所以,应广大用户以及往期学员的要求,爬虫俱乐部将于2019年10月重磅推出第二期的Python编程技术培训。
在针对市面上现有的Python线下课程进行了调研评估后,爬虫俱乐部精心编制了此次课程,内容包含当前主流的数据处理与网络爬虫技术。课程沿袭爬虫俱乐部全案例教学的光荣传统,并辅以知识图谱文档,保证知识全面性、实用性的同时兼顾趣味性。同时为了最大程度保证教学效果,课程安排了相当部分的练习时间与课后的技术答疑。课程的初衷是通过短期的课程,可以使学员迅速掌握爬虫的基本技术与知识背景,可以独立自主地开发爬虫为自身研究服务。
主讲人简介
培训内容
第一天 认识Python、熟悉Python的基础知识
导论
Python的简介、应用前景
Python在数据处理与爬虫上的优势
Python环境安装与脚本运行
Jupyter编程环境简介
第一个Python程序
我们应当如何高效地学习Python爬虫
基础入门
常用数据类型
①数值型变量
②字符串变量
③布尔型变量
运算符
三种流程控制结构
①for
②while
③if
基础升级
常用数据类型
①列表
②字典
函数及方法
第二天 Python基础爬虫
课前知识
pandas简介与基础
第三方库json介绍
爬虫案例
爬虫初步:抓取爬虫俱乐部官网推文(get方式)
爬虫伪装:抓取深交所信息披露考评信息
post型请求页面:抓取和讯网基金经理人信息
抓取基金从业人员资格信息公示网站
配套知识/工具
requests第三方库
服务器请求原理与爬虫的本质工作
HTML文件树概念
网页信息解析库:BeautifulSoup
第三天 Python爬虫
XPath
路径表达式
①使用XPath确定元素
②获取文本内容与文本节点
③获取属性
XPath运算符
使用XPath提取网页信息
①爬取新浪财经上市公司高管任职信息
②爬取新浪财经上市公司公告信息
selenium模拟登录
当前业界反爬措施的总介绍
selenium爬虫的代码理念与爬虫的工程控制
使用selenium抓取深交所信息披露考评数据
使用selenium爬取企查查数据
第四天 文本分析
文本分析基础内容
分词原理
分词实现
高频词统计
图形可视化
案例分析
日料店评论的情感分析
基于TFIDF进行语调分析
上市公司公告的主题模型分析
培训目的
本次培训通过具体的案例对每部分技术进行讲解,力图使大家掌握Python的基本命令、编程、数据处理以及抓取网络数据的方法。专题式的讲解使你能在短时间内掌握Python的精髓,精选的实例和翔实的配套资料能让你在课后快速拓展所学,为进一步学习和科研打下扎实的基础。
培训对象
国内高校教师、硕士生、博士生、科研所科研人员、社会团体及网络爬虫技术爱好者。
报名方式
即日起扫描下方二维码或点击文末阅读原文获得报名表提交报名信息,发送“Python报名表+支付截图”至邮箱:statatraining@163.com,邮件主题为“爬虫俱乐部2019Python十一培训+姓名+单位”。
报名费用及优惠
教师、研究员、企业人员 | 学生 | |
费用(元/人) | 3000 | 2400 |
注:1.费用包含报名费、培训费,食宿自理
2.学生报名需提供有效学生证件
支付方式
对公转账
开户名:武汉字符串数据科技有限公司
开户行:中国银行股份有限公司武汉中南财经政法大学分理处
对公账号:579473738265
对私转账
胡婧 15549490989
相关单位
主办方:武汉字符串数据科技有限公司、爬虫俱乐部
其他事项及培训安排
请学员自带笔记本电脑。
本次培训食宿及往返交通费用学员自理。
即日起开始正式报名和收费。
培训时间地点
报到及软件安装:2019.10.1
上课时间:2019.10.2-2019.10.5
地点:湖北-武汉
联系方式
联系人:胡婧
微信:15549490989
手机:15549490989
QQ :1654896349
邮箱:1654896349@qq.com
对爬虫俱乐部的推文累计打赏超过1000元我们即可给您开具发票,发票类别为“咨询费”。用心做事,只为做您更贴心的小爬虫!
往期推文推荐
关于我们
微信公众号“爬虫俱乐部”分享实用的Stata命令,欢迎转载、打赏。爬虫俱乐部是由李春涛教授领导下的研究生及本科生组成的大数据分析和数据挖掘团队。
此外,欢迎大家踊跃投稿,介绍一些关于stata的数据处理和分析技巧。
投稿邮箱:statatraining@163.com
投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到关于stata分析数据的问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。