查看原文
其他

pandas中鲜为人知的隐藏排序技巧

脚本之家 2022-09-29

The following article is from Python大数据分析 Author 费弗里

 关注
脚本之家
”,与百万开发者在一起
来源 | Python大数据分析 (ID:pydatas)
已获得原公众号的授权转载

本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills

我们即将学习的是:在pandas中实现自然排序顺序

自然排序顺序(Natural sort order),不同于默认排序针对字符串逐个比较对应位置字符的ASCII码的方式,它更关注字符串实际相对大小意义的排序,举个常见的例子,假如我们有下面这样的一张表,其中value字段是百分比格式的字符串:

这时如果直接照常基于value字段进行排序,得到的结果明显不符合数据实际意义:

而我们今天要介绍的技巧,就需要用到第三方库natsort,使用pip install natsort完成安装后,利用其index_natsorted()对目标字段进行自然顺序排序,再配合np.argsort()以及pandassort_values()中的key参数,就可以通过自定义lambda函数,实现利用目标字段自然排序顺序进行正确排序的目的:

可以看到,此时得到的排序结果完美符合我们的需求~

更多natsort知识欢迎前往https://github.com/SethMMorton/natsort学习更多。


本期分享结束,咱们下回见~👋

<END>

程序员专属T恤

商品直购链接 👇

  推荐阅读:

终于!我找到程序员爱穿卫衣的原因了

Python中最强大的错误重试库
Python 的 import 是怎么工作的?

建议收藏:12个Pandas数据处理高频操作

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存