其他
使用 Word2Vec 和 TF-IDF 计算五类企业文化
Kai Li, Feng Mai, Rui Shen, Xinyan Yan, Measuring Corporate Culture Using Machine Learning, The Review of Financial Studies, 2020
摘要: 我们使用最新的机器学习技术——词嵌入模型——和209,480份盈利电话会议记录创建了一本文化词典。我们对2001年至2018年期间的62,664个公司年度观察数据的五个公司文化价值——创新、诚信、质量、尊重和团队合作进行评分。结果表明,创新文化比公司创新的通常衡量标准——研发支出和专利数量——更广泛。此外,我们还表明,企业文化与业务结果相关,包括运营效率、风险承担、盈利管理、高管薪酬设计、企业价值和交易等,并且文化-绩效联系在困难时期更加显著。最后,我们提供了初步证据,表明企业文化受到重大公司事件(如合并和收购)的影响。
内容概况
今天分享的内容主要包括两部分, 即
使用 word2vec 扩展得到五大类企业文化词典 使用 TF-IDF 算法,结合五类文化词典对公司进行评分
算法步骤
构建种子词;人工构建五类企业文化的种子词典, 每类词典人工准备5-10个词 word2vec扩充;使用word2vec扩充五类企业文化词典的词汇量 TF-IDF;将文本数据转为tf-idf格式 计算五类企业文化得分;筛选含有文化词的列,按不同企业文化类别,分别求和得到得分。