其他
一文讲述Pandas库的数据读取、数据获取、数据拼接、数据写出!
1. pandas介绍
2. Excel数据的读取
① sheet_name参数详解
df
df
② header参数详解
df
df
③ usecols参数详解
df = pd.read_excel("readexcel.xlsx",sheet_name="考试成绩表",usecols=[1,2])
df = pd.read_excel("readexcel.xlsx",sheet_name="考试成绩表",usecols="A:B")
df
④ names参数详解
df = pd.read_excel("readexcel.xlsx",sheet_name="copy",header=None,names=name_list)
df
3. Excel数据的获取
① 什么是“位置索引”和标签索引
df
② 访问一列或多列
③ 访问一行或多行
df.iloc[0]
# 标签索引
df.loc["地区1"]
df.iloc[[0,1,3]]
# 标签索引
df.loc[["地区1","地区2","地区4"]]
④ 访问单元格中某个值
df.iloc[2,1]
# 使用标签索引
df.loc["地区3","天门"]
⑤ 访问多行多列
df.iloc[:3,:]
df.loc[["地区1","地区3"],['武汉','孝感','广水']]
df.iloc[:,[1,4]]
df.loc[:"地区2":,["武汉","广水"]]
4. Excel数据的拼接
df2 = pd.read_excel("concat.xlsx",sheet_name="Sheet2")
pd.concat([df1,df2],ignore_index=True)
df2 = pd.read_excel("concat.xlsx",sheet_name="Sheet2")
pd.concat([df1,df2],ignore_index=True).drop_duplicates()
5. Excel数据写出
excel_writer:表示数据写到哪里去,可以是一个路径,也可以是一个ExcelWriter对象。 sheet_name:设置导出到本地的Excel文件的Sheet名称。 index:新导出到本地的文件,默认是有一个从0开始的索引列,设置index=False可以去掉这个索引列。 columns:选则指定列导出,默认情况是导出所有列。 encoding:有时候导出的文件会出现乱码的格式,这个时候就需要使用该参数设置文件编码格式。
df2 = pd.read_excel("concat.xlsx",sheet_name="Sheet2")
df3 = pd.concat([df1,df2],ignore_index=True)
df3.to_excel(excel_writer="to_excel.xlsx",sheet_name="to_excel",index=None)
6. ExcelWriter的使用
df2 = pd.read_excel("concat.xlsx",sheet_name="Sheet2")
with pd.ExcelWriter("excel_writer.xlsx",datetime_format="YYYY-MM-DD") as writer:
df1.to_excel(excel_writer=writer,sheet_name="df1",index=None)
df2.to_excel(excel_writer=writer,sheet_name="df2",index=None)