其他
Faker库 | 生成实验数据
有时候学习新的数据分析方法时,需要构造一些小样本的实验数据,手动构造比较麻烦,这时候可以使用faker库。
安装
pip install Faker
快速上手
from faker import Faker
#设定语言,默认生成的是英文数据
#fake = Faker()
fake = Faker(locale='zh_CN')
#伪造姓名
fake.name()
Run
'张敏'
生成地址数据
fake.address()
Run
'河南省玉华市静安齐齐哈尔路M座 510718'
生成公司数据
fake.company_prefix()
Run
'华泰通安'
自定义
例如生成一个工作经历的实验数据,可以自定义公司名集合,从中随机抽取。
from faker import Faker
fake = Faker()
my_word_list = [
'华为','小米','三星',
'海尔','宝马','保洁',
'中铁','中通','京东',
'阿里','百度','腾讯']
work_experiences = fake.sentence(ext_word_list=my_word_list, nb_words=5)
work_experiences
Run
京东 中铁 三星 腾讯 阿里 中通.
设定随机性
由于faker属于随机生成数据的包,如果不限定状态, 每次运行相同的代码,随机生成的数据是不一样的。
from faker import Faker
fake = Faker('zh_CN')
#设定随机状态
Faker.seed(4321)
print(fake.name())
Run
王鑫
精选文章
FinBERT | 金融文本BERT模型,可情感分析、识别ESG和FLS类型
27G数据集 | 使用Python对27G招股说明书进行文本分析
PNAS | 使用语义距离测量一个人的创新力(发散思维)得分
安装python包出现报错:Microsoft Visual 14.0 or greater is required. 怎么办?