查看原文
其他

pandas技巧 | DataFrame的四则运算

大邓 大邓和他的Python
2024-09-10

DataFrame的四则运算, 涉及到标量数字与数组(列表、series、字典、dataframe)。我们先构造实验数据df

import pandas as pd

df = pd.DataFrame({'angles': [034],
                   'degrees': [360180360]},
                  index=['circle''triangle''rectangle'])
df


一、标量

这里体现的就是pandas独有的广播特性, 使得df可以直接与标量进行运算。以加法为例,

df + 10
#df.add(10)


其他算法

#df - 10
#df.sub(10)

#df * 10
#df.mul(10)

#df / 10
#df.div(10)



二、数组

df与数组(列表、series、字典、dataframe)等进行运算

df


df有两列, [1, 2]有两个元素。默认轴方向为columns, 两者相减

df - [12]
#df.sub([1, 2], axis='columns')


生成一个series数据, 有三行, 索引名设置为circle、triangle、rectangle。

df与series相减, 轴方向设置为index

series = pd.Series([111], 
                 index=['circle''triangle''rectangle'])

df.sub(series, axis='index')


字典有两个字段名, 与df字段名相同。轴方向设置为columns, 两者相乘

df.mul({'angles'0'degrees'2}, axis='columns')


字典有三个字段名, 与df的index相同。轴方向设置为index, 两者相乘

df.mul({'circle'0'triangle'2'rectangle'3}, axis='index')




精选内容

LIST | 社科(经管)可用数据集列表
LIST | 文本分析代码列表
LIST | 社科(经管)文本挖掘文献列表
管理科学学报 | 使用「软余弦相似度」测量业绩说明会「答非所问程度」
数据集  | 人民网政府留言板原始文本(2011-2023.12)
数据集  |  人民日报/经济日报/光明日报 等 7 家新闻数据集
可视化 | 人民日报语料反映七十年文化演变
数据集 | 2024年中国全国5级行政区划(省、市、县、镇、村)
数据集 | 三板上市公司年报2002-2023.12
数据集 | 人民网地方领导留言板原始文本(2011-2023.12)
数据集 | 3571万条专利申请数据集(1985-2022年)
数据集 |  专利转让数据集(1985-2021)
数据集 | 288w政府采购合同公告明细数据(2023.09)
数据集 | 用来练习pandas的招聘数据
代码 | 使用 3571w 专利申请数据集构造面板数据
代码 | 使用「新闻数据集」计算 「经济政策不确定性」指数
数据集 | 国省市三级gov工作报告文本
代码 | 使用「新闻数据」生成概念词频「面板数据」
代码 | 使用 3571w 专利申请数据集构造面板数据
代码 | 使用gov工作报告生成数字化词频「面板数据」
Polars库 | 最强 Pandas 平替来了
cpca库 | 中国省、市区划匹配库
opencc | 中文简体、繁体转换库
可视化 | 使用 DataMapPlot 绘制数据地图


继续滑动看下一个
大邓和他的Python
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存