查看原文
其他

建议收藏!Python精选推文干货合集

爬虫俱乐部 Stata and Python数据分析 2022-03-15
      爬虫俱乐部于2020年暑期在线上举办的Stata与Python编程技术训练营和Stata数据分析法律与制度专题训练营在不久前已经圆满结束啦~应广大学员需求,我们的课程现已在腾讯课堂全面上线,且继续提供答疑服务。现在关注公众号并在朋友圈转发推文《来腾讯课堂学Stata和Python啦》或《8月Stata数据分析法律与制度专场来啦!》,即可获得600元课程优惠券,集赞50个再领200元课程优惠券!(截图发至本公众号后台领取)原价2400元的课程,现在只要1600元!     


在上周的推文《【小白指南】Python中有哪些数据类型?(附推文合集)》《Python推文合集基础篇(下)|算法简介》,我们对爬虫俱乐部过去发布的Python基础类推文进行了整理,今天,小编为大家整理了Python的高阶应用,内容涉及网络爬虫、数据可视化的精选案例,pandas和机器学习的详细讲解以及办公自动化的具体应用,大家快快点击右上角收藏~

网络爬虫

正则表达式使用指南

Python标准库re:正则表达式

Python标准库re:正则表达式(二)

妙用正则表达式--Python中的re模块

妙用正则表达式--Python中的re模块(二)

巧用正则表达式进行爬虫

手把手教你爬豆瓣Top250的电影

手把手教你爬豆瓣Top250的电影(二)

手持Python,斗图不输!

知识练兵--python爬取国家社科基金项目数据库

实战演练——爱婴医院中莆田系医院数据分析(一)

爬虫利器-BeautifulSoup

Python之BeautifulSoup模块:处理HTML文档的利器

Python之BeautifulSoup模块:解析文档树的利器(二)

爬取东方财富网当日股票交易情况

Python 爬取豆瓣电影评论并生成词云图(一)

Python 爬取豆瓣电影评论并生成词云图(二)

爬虫利器-Xpath Helper

Requests get爬虫之设置headers

寻找B站的最爱--8月B站全站榜爬虫

XPath Helper助XPath爬虫一臂之力

解析XML文件

Python带你看文献—xpath抓取知网文献

自科基金项目信息爬取

爬虫利器-selenium

Selenium登录豆瓣

Selenium的等待方式

过年观影指南(一)

过年观影指南(二)

中国知网爬虫(CNKI) 批量下载PDF格式论文

爬虫俱乐部助你回家—12306余票监测(一)

爬虫俱乐部助你回家—12306余票监测(二)

Python爬虫之selenium爬取国际自然科学基金数据库(一)

Python爬虫之selenium爬取国家自然科学基金数据库(二)

json格式数据抓取

爬虫实战——聚募网股权众筹信息爬取

爬虫实战程序的函数封装

玩转Python之“手把手”教你爬数据(一)

玩转Python之“手把手”教你爬数据(二)

实战演练-如何获取众筹项目的团队信息

实战演练-爬取深交所年报

豆瓣电影评分之数据爬取与可视化的实现

用requests库爬取淘宝数据

查询12306车次信息

今日头条海外疫情数据爬取

海外疫情仍严峻,劝君更在家中留

高阶实战

Scrapy—轻量级爬虫框架(一)

Scrapy—轻量级爬虫框架(二)

另辟蹊径js逆向爬取百度翻译

数据可视化

pyecharts

基础图表

Python数据可视化神器:pyecharts (一)

Python数据可视化神器:pyecharts (二)

实战演练-明星微博热搜次数的数据可视化

您有一份天气预报待签收

对《陈情令》的数据可视化分析

一篇有情怀的Python伪技术贴

图表组合

多图“预警”(一)

多图“预警”(二)

地图

数据可视化之地理图

数据可视化之地理坐标系

古代诗人总去的这些地方你一定要知道!

词云图

来!左边跟我一起画个龙在你右边画一道彩虹~

爬虫+可视化

豆瓣电影评分之数据爬取与可视化的实现

海外疫情仍严峻,劝君更在家中留

Python高能绘图 | 解锁分析唐诗新技能

matplotlib

matplotlib绘制数学函数

如何用简单的手法绘制出不一样的海外疫情趋势图

数据分析

Numpy&pandas

Pandas基本数据类型介绍

Pandas之数据的读入与导出

Pandas之缺失值处理

Pandas之分组计算

Pandas之数据查询与修改

Python之数据合并与连接

NumPy数组基本介绍

DataFrame数组常用方法

Pandas中数据的排序与切片

DataFrame数组常用方法(二)

用数据透视表剖析泰坦尼克号乘客数据

自己动手进行线性回归计算

Pandas中节约空间的小tip—categorical类型

Pandas的GroupBy机制

Python实现Excel中vlookup函数功能

机器学习

Sklearn入门之多元线性回归

Sklearn入门之线性判别分析

Sklearn入门之k-means聚类算法

Sklearn入门之决策树

NBA球员薪资分析——基于随机森林算法(一)

NBA球员薪资分析——基于随机森林算法(二)

“物以类聚”、“近朱者赤”——机器学习初探之KNN

“抽丝剥茧”,层层下分——机器学习基本算法之决策树

基于贝叶斯定理的算法——朴素贝叶斯分类

基于广义线性模型的机器学习算法——线性回归

线性回归的正则化 ——岭回归与LASSO回归

从statsmodels到线性回归

利用广义线性模型实现的分类——Logistic回归

换种视角看问题——支持向量机(SVM)

取长补短、互通有无 ——集成学习介绍之Bagging &随机森林

集成学习介绍之二——Boosting算法

集成学习介绍之三——Stacking算法

数据集的划分——交叉验证法

文件处理

办公自动化

用python如何批量统计word字数

用Python批量转换.doc文件

让python帮你自动统计Word文档信息

新的一年,效率满满~(上)

新的一年,效率满满~(下)

批量实现WORD转PDF

用Python提取pdf文件中的表格数据

Zipfile(一)

zipfile(二)

PDF处理

提取PDF文本信息:入门

PDF表格信息提取

PDF文本信息提取(二)

PyMuPDF提取文本信息

PDF图片提取

PDF文档转换成图片

一个函数实现PDF文档合并与拆分

图片处理

python-手把手教你做图片识别:Pillow+pytesseract+tesseract

图像处理库—PIL库简介

教你把Python当美图秀秀用(一)

教你把Python当美图秀秀用(二)

圆蛋快乐

Python图形可视化之graphviz

一个简单又有趣的Python库——MyQR





对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!往期推文推荐        xpose和sxpose,谁是卧底?       让你的数据一目了然--label命令介绍Python推文合集基础篇(下)|算法简介【小白指南】Python中有哪些数据类型?(附推文合集)

轻松获取通行数据——cntraveltime命令介绍

让Stata完美牵手中国地图之cnmapsearch

自然语言分析——利用NLTK进行文本预处理

寻找B站的最爱--8月B站全站榜爬虫

cnaddress命令——实现经纬度转换为中文地址

定位神器——cngcode

Python入门—Spyder的简单使用

Jupyter Notebook 的这些tips你了解吗?给变量名换马甲之rename命令

追踪命令set trace on——解你燃眉之急

爬虫大杀器 | “手把手”教你配置Selenium

小白必看!Anaconda安装全攻略

数据类型转换之destring和tostring命令

关于我们


微信公众号“Stata and Python数据分析”分享实用的stata、python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。

此外,欢迎大家踊跃投稿,介绍一些关于stata和python的数据处理和分析技巧。投稿邮箱:statatraining@163.com投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存