查看原文
其他

软件应用 | 一张图就能彻底搞定Pandas!

刘早起 数据Seminar 2023-01-01


本文转载自公众号早起python


昨天在面向GitHub编程时,无意发现了Pandas官方竟提供了同款小抄,项目地址如下

https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf

可以看到这份小抄提供了PPT和PDF两个版本,虽然最新一条更新记录为两年前,但是并不影响我们拿来学习,下面我们来看看这份小抄(速查表) 的强大!

这份速查表一共有两页,我已经将它转换为图片👇发在公众号可能会被压缩,你可以在文末下载高清大图

经过一番研究,这两张图片一共覆盖了12个常用的Pandas操作👇

1、数据创建

介绍了几种常用的DataFrame创建语法

2、数据重塑

这部分主要是一些在数据清洗中常用的方法,比如数据连接、数据排序、数据删除等,并且还对四个常用的操作给出了图示,理解起来简直不要太方便!

3、数据筛选

这一块区域主要是分别用行/列来讲解一些常用的数据查看、抽样、切片等操作,包含了tailheadlociloc等非常重要的方法,并且同样给出了部分动画便于理解

4、数据探索

这一块主要给出了一些在进行探索性分析时常用的方法,比如maxmincount等,不过官方将apply放在这里,并没有展开讲解

5、数据修改

这两个区域为缺失值处理和创建新的列,重点用动画示例了assignqcut方法,缺失值处理部分仅给出了两个方法,应该是偷懒了

6、数据分组

主要就是groupby和相关方法

7、数据连接

这里介绍的还是非常详细!用图片例子来展示pd.merge中的各种参数变化的不同,一看就懂

以上就是我对这份小抄的基本概括,其实大家应该清楚,仅仅靠靠两张图片根本没法把整个Pandas学明白,所以官方也有选择性的对一些重要的方法给出了详细的讲解,而有些功能则一笔带过,比如我之前👉花很大力气介绍的pandas绘图功能仅给出了区区一角

所以你应该这样用这份小抄,把它当成速查表,「用于了解哪些操作可以用Pandas完成」在你不确定或者不明白如何处理数据时,通过这份速查表快速查到Pandas中的哪个方法可以完成,之后再进一步通过搜索学习对应的方法!

好了,以上就是本文全部内容,因为微信会对图片进行压缩,所以你可以在后台回复pandas获取高清、完整、可复制文字版本Pandas速查表!

-END-










点击阅读原文进入CCAD数据库



·END·


星标⭐我们不迷路!

想要文章及时到,文末“在看”少不了!


点击搜索你感兴趣的内容吧


往期推荐


机器学习 | 5个基本概念,从统计学到机器学习

好享学丨为什么数据科学家需要了解可视化

学术前沿丨细数农经领域的国际权威期刊(内含链接)

机器学习 | 算法与模型的区别

因果推断 | 发展史

推荐 | READ团队龚斌磊、鄢贞课题组博士后招聘启事

统计计量 | 做研究之前如何用Stata进行数据清理?








数据Seminar




这里是大数据、分析技术与学术研究的三叉路口



文丨早起python

推荐丨青酱



    欢迎扫描👇二维码添加关注    

点击下方“阅读全文”了解更多

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存