其他
Pandas中数据的排序与切片
本文作者:孙晓玲
文字编辑:孙晓玲
在《DataFrame数组常用方法》中,我们介绍了查看数据和数据的描述性统计的相关操作。在文中,将继续使用生成的以日期索引dates为行索引、以[a,b,c,d,e] 为列索引的DataFrame数组进行演示,并沿用上篇文章生成的数据。
一、数据排序
df.sort_index(axis=1, ascending=False)
df.sort_values(by='b')
二、切片方式
df['a']
df.a
df[0:3]
用df.loc[index,columns]索引,index为行索引范围,columns为列索引范围。这里演示通过标签在多个轴上索引数据,选择行索引从“2019-11-02到2019-11-05”列索引从“b到d”的切片。
df.loc['2019-11-02':'2019-11-05','b':'d']
3.按位置切片
用df.iloc[index,columns]索引,index为行索引范围,columns为列索引范围。与df.loc[index,columns]用法相似,这里演示通过标签在多个轴上索引数据,选择所有行,第1到2列。
df.iloc[:, 1:3]
4.布尔切片
有时候我们需要得到满足某个条件的数据,就可以用到布尔索引,它可以实现筛选数据的目的。
df[df.a > 0]
这里用布尔切片得到列a>0的数据。
关于Pandas数组的基本操作方法在这两篇文章中已经如数奉上啦,宅在家里也要继续学习~
自科基金项目信息爬取
关于我们
微信公众号“Stata and Python数据分析”分享实用的stata、python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。
1)必须原创,禁止抄袭;
2)必须准确,详细,有例子,有截图;
注意事项:
1)所有投稿都会经过本公众号运营团队成员的审核,审核通过才可录用,一经录用,会在该推文里为作者署名,并有赏金分成。
2)邮件请注明投稿,邮件名称为“投稿+推文名称”。
3)应广大读者要求,现开通有偿问答服务,如果大家遇到有关数据处理、分析等问题,可以在公众号中提出,只需支付少量赏金,我们会在后期的推文里给予解答。