查看原文
其他

不止高效,原来pandas表格可以更美的!

派森酱 Python技术 2022-10-07

文 | ssw

来源:Python 技术「ID: pythonall」

我负责十多个地灾项目,经常需要了解设备的离线情况。公司网站按项目提供了excel表格,看起来较乱,这是下载的数据:

从原始表格里,不太容易看出这些信息:

  • 这个项目下有哪些设备类型
  • 每种类型有多少设备在线
  • 设备上线的时间顺序

这是用脚本,将数据排序分组配色后的效果(脚本和数据文件见文末)

排序

先将“最后上线时间”一列设置为行索引,使用pd.to_datetime转换为datetime类型,再排序

import pandas as pd
from datetime import datetime,timedelta
df2 = pd.read_excel("C:/sf3/sf3/excel/1170_04-28.xlsx",sheet_name="邵阳")

#将“最后上线时间”一列设置为行索引
new = df2.set_index(pd.to_datetime(df2['最后上线时间']))
#新列重命名
new.index.name = 'last'
#按时间排序
new.sort_values('最后上线时间', ascending=True,inplace=True)

输出:

分组

分组可以从“设备别名”这列获取,新增一列“设备类型”

#新增一列“设备类型”
new['设备类型'] = new['设备别名'].str.split('0').str[0].str.split(' ').str[0]
new2 = new.groupby(['设备类型','最后上线时间','设备别名','连接状态','所属监测点'],as_index=False)
new3 = new2.all()

输出:

配色

  1. 一周内离线的设备,用蓝色标注
now = datetime.now().strftime('%Y-%m-%d')
sevenDaysAgo = (datetime.now() + timedelta(days=-7)).strftime('%Y-%m-%d')
new3.style.highlight_between(left=sevenDaysAgo,right=now,subset=['最后上线时间'],props='font-weight:bold;color:rgb(64, 158, 255)')

输出:

  1. 给每种类型加上颜色
new3.style.highlight_between(left=sevenDaysAgo,right=now,subset=['最后上线时间'],props='font-weight:bold;color:rgb(64, 158, 255)')\
.highlight_between(left='普适型声光报警器',right='普适型声光报警器',subset=['设备类型'],props='background:#c7f5fe')\
.highlight_between(left='普适型声光报警器',right='声光报警器',subset=['设备类型'],props='background:#c7f5fe')\
.highlight_between(left='普适型GNSS基准站',right='普适型GNSS基准站',subset=['设备类型'],props='background:#ffa5a5')\
.highlight_between(left='普适型GNSS监测站',right='普适型GNSS监测站',subset=['设备类型'],props='background:#a1eafb')\

输出:

  1. 在线状态的设备,用黄色标注
.highlight_between(left='在线',right='在线',subset=['连接状态'],props='background:#f9ed69')

输出:

脚本和数据文件

文件下载地址:http://ssw.fit/file/

import pandas as pd
from datetime import datetime,timedelta
df2 = pd.read_excel("C:/sf3/sf3/excel/1170_07-28.xlsx",sheet_name="邵阳")

new = df2.set_index(pd.to_datetime(df2['最后上线时间']))
new.index.name = 'last'
new.sort_values('最后上线时间', ascending=True,inplace=True)

new['设备类型'] = new['设备别名'].str.split('0').str[0].str.split(' ').str[0]
new2 = new.groupby(['设备类型','最后上线时间','设备别名','连接状态','所属监测点'],as_index=False)

new3 = new2.all()
now = datetime.now().strftime('%Y-%m-%d')
sevenDaysAgo = (datetime.now() + timedelta(days=-7)).strftime('%Y-%m-%d')
new3.style.highlight_between(left=sevenDaysAgo,right=now,subset=['最后上线时间'],props='font-weight:bold;color:rgb(64, 158, 255)')\
.highlight_between(left='普适型声光报警器',right='普适型声光报警器',subset=['设备类型'],props='background:#c7f5fe')\
.highlight_between(left='普适型声光报警器',right='声光报警器',subset=['设备类型'],props='background:#c7f5fe')\
.highlight_between(left='普适型GNSS基准站',right='普适型GNSS基准站',subset=['设备类型'],props='background:#ffa5a5')\
.highlight_between(left='普适型GNSS基站',right='普适型GNSS基站',subset=['设备类型'],props='background:#ffa5a5')\
.highlight_between(left='普适型GNSS监测站',right='普适型GNSS监测站',subset=['设备类型'],props='background:#a1eafb')\
.highlight_between(left='普适型裂缝计',right='普适型裂缝计',subset=['设备类型'],props='background:#a6e3e9')\
.highlight_between(left='普适型雨量计',right='普适型雨量计',subset=['设备类型'],props='background:#71c9ce')\
.highlight_between(left='在线',right='在线',subset=['连接状态'],props='background:#f9ed69')\
.highlight_between(left='普适型变形桩',right='普适型变形桩',subset=['设备类型'],props='background:#cbf1f5')

总结

项目经理要我整理某个项目的离线表给他,修改下脚本里的sheet_name即可。是不是省事呢?

  • 省去登录网站下载excel
  • 省去整理表格

如果你觉得本文对你有帮助,还请点个赞支持一下~

本文是由 Python技术 公众号粉丝 SSW 投稿,欢迎大家继续踊跃投稿!

PS公号内回复「Python」即可进入Python 新手学习交流群,一起 100 天计划!


老规矩,酱友们还记得么,右下角的 “在看” 点一下如果感觉文章内容不错的话,记得分享朋友圈让更多的人知道!

代码获取方式

识别文末二维码,回复:酱子




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存