查看原文
其他

Pandas中数据的排序与切片

爬虫俱乐部 Stata and Python数据分析 2022-03-15

本文作者:孙晓玲

文字编辑:孙晓玲

技术总编:张   邯

《DataFrame数组常用方法》中,我们介绍了查看数据和数据的描述性统计的相关操作。在文中,将继续使用生成的以日期索引dates为行索引、以[a,b,c,d,e] 为列索引的DataFrame数组进行演示,并沿用上篇文章生成的数据。


一、数据排序

按轴排序可用方法:
.sort_index(axis=int, ascending=bool)
对数据进行按横(纵)轴排序,其中axis表示对横轴设置,ascending对列索引进行设置。参数取值及对应含义如下表所示。

这里以按行索引升序,列索引降序为例。
df.sort_index(axis=1, ascending=False)

按值排序。可用.sort_values(by = str)方法对数据进行按值排序,by设置为排序依据。这里演示按列b排序为例,当然若需要按指定日期排序,可以先转置再使用.sort_values(by = str)进行排序操作。
df.sort_values(by='b')


二、切片方式

DataFrame数组的切片方式丰富,接下来就为大家一一介绍。
1.通过“[ ]”切片
将所需切片的范围放入[ ]中进行切片。选择一个列,产生一个“Series”,例如df[‘a’],其效果相当于df.a;df[0:3]选择前三行的数据。
df['a']df.adf[0:3]

2.按标签索引

df.loc[index,columns]索引,index为行索引范围,columns为列索引范围。这里演示通过标签在多个轴上索引数据,选择行索引从“2019-11-02到2019-11-05”列索引从“b到d”的切片

df.loc['2019-11-02':'2019-11-05','b':'d']

3.按位置切片

df.iloc[index,columns]索引,index为行索引范围,columns为列索引范围。与df.loc[index,columns]用法相似,这里演示通过标签在多个轴上索引数据,选择所有行,第1到2列。

df.iloc[:, 1:3]

4.布尔切片

有时候我们需要得到满足某个条件的数据,就可以用到布尔索引,它可以实现筛选数据的目的。

df[df.a > 0]

这里用布尔切片得到列a>0的数据。

关于Pandas数组的基本操作方法在这两篇文章中已经如数奉上啦,宅在家里也要继续学习~





对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!
往期推文推荐

DataFrame数组常用方法

巧用局部宏扩展函数dir

过了14天潜伏期真的没事了?

Pandas基本数据类型介绍

NumPy数组基本介绍

“个性化”sortobs命令,教你实现排序自由

携手战疫,我们在行动

恭贺新春,平安顺遂|各省疫情关注度地图

过年观影指南(二)

过年观影指南(一)

egenmore隐藏功能——进制转换

相遇insobs,如暗室逢灯

数据可视化之地理坐标系

SFI:Stata与Python的数据交互手册(一)
Stata模拟构建朋友圈
一个粉丝的疑惑—— local和scalar
新的一年,效率满满~(下)

自科基金项目信息爬取

关于我们



微信公众号“Stata and Python数据分析”分享实用的stata、python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。

此外,欢迎大家踊跃投稿,介绍一些关于stata和python的数据处理和分析技巧。
投稿邮箱:statatraining@163.com
投稿要求:
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存