专题培训|文澜金融2020金融科技工具箱专题培训: Python与金融数据分析
文澜金融2020金融科技工具箱专题培训
Python 与 金融数据分析
01
课程介绍
本次培训采用理论与案例相结合的方式,旨在帮助零基础学员轻松入门Python,由浅入深学习和掌握Python的编程技术,特别是爬虫技术和文本分析技术。
本课程共四天。第一天是Python编程入门,带领学员迅速了解Python的原生语法规则、Jupyter编程环境与代码规范,使得学员能使用Python编写和执行最基本的程序;第二天将介绍简单的Python爬虫技术,深入了解HTTP协议、HTML语言、BeautifulSoup和Requests等Python第三方库的运用;第三天将学习基于路径表达式xpath的爬虫技术和基于selenium模拟登陆的爬虫案例以及爬虫数据处理。
02
课程时间、地点
1.时间
6月15日(周一)至18日(周四)
上午9:00-11:30
下午14:30-17:00
2.地点
腾讯会议
03
授课对象
金融学院全体教师、研究生和“优本计划”班
04
爬虫俱乐部简介
爬虫俱乐部由中南财经政法大学李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队,已针对教师和研究生多次举办Stata和Python的编程课程,曾经在厦门大学、武汉大学、华中科技大学、中央财经大学、华中农业大学、西南财经大学、西南政法大学、郑州大学、河南大学、福州大学、长沙理工大学、广西大学、石河子大学、新疆财经大学、郑州大学和湖北大学等多所高校进行培训,反应良好。
05
主讲人简介
1.薛原
香港岭南大学研究助理,爬虫俱乐部高级成员,擅长Stata编程、正则表达式、字符串处理及Python网络爬虫技术。与李老师合作开发了chinagcode、chinaaddress、cnintraday、cnstock、subinfile、reg2docx、sum2docx、wordconvert等重要命令,实现了中文地址与经纬度之间的转换,中国上市公司股票代码和分时交易数据的获取以及修改文本文件,在《金融研究》发表过文章。
2.张计宝
香港理工大学研究助理,爬虫俱乐部高级成员,擅长Stata及Python编程、正则表达式、数据处理、文本分析技术及网络爬虫技术。在《财政研究》等期刊发表学术论文数篇。
3.张学人
武汉大学研究助理,爬虫俱乐部高级成员,擅长Stata、Python编程,字符串处理及网络爬虫技术,与李春涛教授合作开发cntraveltime、cnmapsearch等命令,拥有丰富的Python编程及项目经验。
06
培训大纲
6月15日 周一
第一天 认识Python、熟悉Python的基础知识
导论
Python的简介、应用前景
Python在数据处理与爬虫上的优势
Python环境安装与脚本运行
Jupyter编程环境简介
第一个Python程序
我们应当如何高效地学习Python爬虫
基础入门
常用数据类型
①数值型变量
②字符串变量
③布尔型变量
运算符
三种流程控制结构
①for
②while
③if
基础升级
常用数据类型
①列表
②字典
函数及方法
6月16日 周二
第二天 Python爬虫基础
课前知识
pandas简介与基础
第三方库json介绍
爬虫案例
爬虫初步:抓取爬虫俱乐部官网推文(get方式)
爬虫伪装:抓取深交所信息披露考评信息
post型请求页面:抓取和讯网基金经理人信息
抓取基金从业人员资格信息公示网站
配套知识/工具
requests第三方库
服务器请求原理与爬虫的本质工作
HTML文档树概念
网页信息解析库:BeautifulSoup
6月17日 周三
第三天 Python爬虫技术
XPath
路径表达式
①使用XPath确定元素
②获取文本内容与文本节点
③获取属性
XPath运算符
使用XPath提取网页信息
①爬取新浪财经上市公司高管任职信息
②爬取新浪财经上市公司公告信息
selenium模拟登录
当前业界反爬措施的总介绍
selenium爬虫的代码理念与爬虫的工程控制
使用selenium抓取深交所信息披露考评数据
使用selenium爬取企查查数据
6月18日 周四
第四天 Python与文本分析
文本分析基础内容
分词原理
分词实现
高频词统计
图形可视化
案例分析
日料店评论的情感分析
基于TFIDF进行语调分析
上市公司公告的主题模型分析
💁
扫描下方二维码报名吧~温 馨 提 示:
由于服务器承载能力有限,故只能按照报名的先后顺序接受100人报名,请各位有意学习的师生速速报名哦。我们将在您报名成功后,逐一与您联络接入课程的细节事宜。END