其他
数据集 | 2001-2022年A股上市公司年报&管理层讨论与分析
2001-2022年A股年报数据集,含2个文件,共2G。
年报 A01-22.xlsx
管理层讨论与分析 mda01-22.xlsx
xlsx与csv相比,同样的数据量,文件体积会小很多。截图对比
注意, 当数据的记录数小于100w条, 数据如果不考虑体积,存储到csv和xlsx都是okay的,推荐xlsx。当数据记录数大于100w, 只能存储到csv。
数据获取
内容为付费数据集, 转发积攒50+ 或 50元购买, 加微信 372335839, 备注「姓名-学校-专业」
一、年报数据
2001-2022年, 年报数据
import pandas as pd
df = pd.read_excel('A01-22.xlsx')
df.head()
Run
len(df)
Run
55222
二、MD&A数据
2001-2022年MD&A数据
import pandas as pd
mda_df = pd.read_excel('mda01-22.xlsx')
mda_df.head()
Run
len(mda_df)
Run
55439
精选内容
数据集 | 3571万条专利申请数据集(1985-2022年)
管理世界 | 用正则表达式、文本向量化、线性回归算法从md&a数据中计算 「企业融资约束指标」
管理世界 | 机器学习如何赋能管理学研究?——国内外前沿综述和未来展望
中国管理科学 | 使用业绩说明会文本数据测量上市公司前瞻性信息
数据集 | 2001-2022年A股上市公司年报&管理层讨论与分析
数据集 | 200w政府采购合同公告明细数据(1996.6-2022.12)