软件应用丨一文看懂用Python读取Excel数据
The following article is from 大数据DT Author 宋天龙
本文来源于大数据DT(ID:bigdatadt),作者:宋天龙,本文摘编自《Python数据分析与数据化运营》(第2版)。
导读:现有的Excel分为两种格式:xls(Excel 97-2003)和xlsx(Excel 2007及以上)。
▼
!pip install xlrd
左右滑动查看更多
▲数据文件内容
import xlrd # 导入库
# 打开文件
xlsx = xlrd.open_workbook('demo.xlsx')
# 查看所有sheet列表
print('All sheets: %s' % xlsx.sheet_names())
左右滑动查看更多
All sheets: ['Sheet1']
左右滑动查看更多
sheet1 = xlsx.sheets()[0] # 获得第1张sheet,索引从0开始
sheet1_name = sheet1.name # 获得名称
sheet1_cols = sheet1.ncols # 获得列数
sheet1_nrows = sheet1.nrows # 获得行数
print('Sheet1 Name: %s\nSheet1 cols: %s\nSheet1 rows: %s' % (sheet1_name, sheet1_cols, sheet1_nrows))
左右滑动查看更多
Sheet1 Name: sheet1
Sheet1 cols: 4
Sheet1 rows: 10
左右滑动查看更多
sheet1_nrows4 = sheet1.row_values(4) # 获得第4行数据
sheet1_cols2 = sheet1.col_values(2) # 获得第2列数据
cell23 = sheet1.row(2)[3].value # 查看第3行第4列数据
print('Row 4: %s\nCol 2: %s\nCell 1: %s\n' % (sheet1_nrows4, sheet1_cols2, cell23))
左右滑动查看更多
Row 4: ['431381197408191515', '有效', 42725.0, '深圳市']
Col 2: ['Create_Time', 42725.0, 42725.0, 42725.0, 42725.0, 42725.0, 42725.0, 42725.0, 42725.0, 42725.0]
Cell 1: 深圳市
左右滑动查看更多
for i in range(sheet1_nrows): # 逐行打印sheet1数据
print(sheet1.row_values(i))
左右滑动查看更多
['ID_number', 'Status', 'Create_Time', 'Business_City']
['431381198109106573', '有效', 42725.0, '深圳市']
['431381198809122734', '有效', 42725.0, '深圳市']
…
['431381198901176911', '有效', 42725.0, '深圳市']
['43138119870827275X', '有效', 42725.0, '深圳市']
关于作者:
宋天龙,深大数据技术专家,触脉咨询合伙人兼副总裁,前Webtrekk中国区技术和咨询负责人(德国最大在线数据分析服务提供商)。擅长数据挖掘、建模、分析与运营,精通端到端数据价值场景设计、业务需求转换、数据结构梳理、数据建模与学习以及数据工程交付。在电子商务、零售、银行、保险等多个行业拥有丰富的数据项目工作经验。
·END·
软件应用丨数据迁移的几种方式 - MySQL数据库
数据资源丨新冠研究数据哪里找?科研工作者必看(建议收藏)
统计计量丨神仙打架的统计学发展史
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
出处:大数据DT
作者:宋天龙
推荐:青酱
欢迎扫描👇二维码添加关注