Faker库 | 生成实验数据

Original 大邓大邓和他的Python

2024-09-09

有时候学习新的数据分析方法时，需要构造一些小样本的实验数据，手动构造比较麻烦，这时候可以使用faker库。

安装

pip install Faker

快速上手

from faker import Faker

#设定语言，默认生成的是英文数据
#fake = Faker()
fake = Faker(locale='zh_CN')

#伪造姓名
fake.name()

Run

'张敏'

生成地址数据

fake.address()

Run

'河南省玉华市静安齐齐哈尔路M座 510718'

生成公司数据

fake.company_prefix()

Run

'华泰通安'

自定义

例如生成一个工作经历的实验数据，可以自定义公司名集合，从中随机抽取。

from faker import Faker
fake = Faker()

my_word_list = [
'华为','小米','三星',
'海尔','宝马','保洁',
'中铁','中通','京东',
'阿里','百度','腾讯']

work_experiences = fake.sentence(ext_word_list=my_word_list, nb_words=5)
work_experiences

Run

京东 中铁 三星 腾讯 阿里 中通.

设定随机性

由于faker属于随机生成数据的包，如果不限定状态，每次运行相同的代码，随机生成的数据是不一样的。

from faker import Faker
fake = Faker('zh_CN')

#设定随机状态
Faker.seed(4321)

print(fake.name())

Run

王鑫

精选文章

管理世界 | 使用文本分析词构建并测量短视主义
管理世界 | 使用经营讨论与分析测量企业数字化指标
支持开票 | Python实证指标构建与文本分析
推荐 | 社科(经管)文本分析快速指南
视频分享 | 文本分析在经管研究中的应用
转载 | 金融学文本大数据挖掘方法与研究进展
FinBERT | 金融文本BERT模型，可情感分析、识别ESG和FLS类型
训练&使用Glove语言模型，可度量刻板印象等
从符号到嵌入：计算社会科学的两种文本表示
资料 | 量化历史学与经济学研究
长期征稿 | 欢迎各位前来投稿
17G数据集 | 深交所企业社会责任报告
70G数据集 | 上市公司定期报告数据集
27G数据集 | 使用Python对27G招股说明书进行文本分析
数据集 | 90w条中国上市公司高管数据
Maigret库 | 查询某用户名在各平台网站的使用情况
MS | 使用网络算法识别创新的颠覆性与否
Asent库 | 英文文本数据情感分析
PNAS | 文本网络分析&文化桥梁Python代码实现
PNAS | 使用语义距离测量一个人的创新力(发散思维)得分
tomotopy | 速度最快的LDA主题模型
100min视频 | Python文本分析与会计
安装python包出现报错：Microsoft Visual 14.0 or greater is required. 怎么办？
如何正确读入文本数据不乱码(解决文本乱码问题)

继续滑动看下一个

大邓和他的Python

向上滑动看下一个

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

洗牌电商圈！阿哲放话全网：挑战抖音所有机制！爆全品类大牌！

阿哲现身评论区，@一修！肉肉痛哭，无限期停播！回应舆论黑料，关闭私信评论区！

登热榜！某牙电母被S，榜一求爱遭拒！柚柚阿哲合体年度走红毯！

小敏感喊话阿哲，出镜抖音！欠钱不还，小白龙再被扒借贷官司！

Faker库 | 生成实验数据

安装

快速上手

自定义

设定随机性

精选文章

您可能也对以下帖子感兴趣

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

洗牌电商圈！阿哲放话全网：挑战抖音所有机制！爆全品类大牌！

阿哲现身评论区，@一修！肉肉痛哭，无限期停播！回应舆论黑料，关闭私信评论区！

登热榜！某牙电母被S，榜一求爱遭拒！柚柚阿哲合体年度走红毯！

小敏感喊话阿哲，出镜抖音！欠钱不还，小白龙再被扒借贷官司！

生成图片，分享到微信朋友圈

Faker库 | 生成实验数据

安装

快速上手

自定义

设定随机性

精选文章

您可能也对以下帖子感兴趣