查看原文
其他

嵌入 (embedding) 方法介绍以及在社科领域的应用 | 周六直播·计算社会科学读书会

集智俱乐部 集智俱乐部 2022-07-08


导语


计算社会科学读书会第二季第三期,我们邀请到了斯坦福大学组织行为学博士研究生陈梓文,为我们分享嵌入模型在社科研究中的应用,介绍什么是嵌入模型、嵌入模型的基本原理与功能、嵌入模型在社科研究中的应用案例、嵌入模型的优缺点等内容,并分享嵌入模型相关的论文与工具,使大家快速理解如何在自己的研究中使用嵌入模型。本期读书会时间为:7月2日上午10:00-12:00(周六),直播报名入口见后文。


计算社会科学读书会第二季】由清华大学罗家德教授领衔,卡内基梅隆大学、密歇根大学、清华大学、匹兹堡大学的多位博士生联合发起,自2022年6月18日开始,持续10-12周。本季读书将聚焦讨论Graph、Embedding、NLP、Modeling、Data collection等方法及其与社会科学问题的结合,并针对性讨论预测性与解释性、新冠疫情研究等课题。读书会详情及参与方式见文末,欢迎从事相关研究或对计算社会科学感兴趣的朋友报名参加!





背景




随着计算社会科学的发展,自然语言处理(NLP)被广泛应用于文本数据之上,用于更好地理解人类行为与文化。本期读书会主要介绍自然语言处理的核心方法之一: 嵌入(Embedding)模型。嵌入模型能够将文本转换成数学向量,沟通了人与计算机对于语言分析的桥梁。基于大规模的文本数据的训练,嵌入模型生成的数学向量能够完好地保存文字的语义信息以及文字之间的关系。基于嵌入模型,社科学者得以建构量化指标来研究包括情感认知、社会偏见、知识文化、企业创新等一系列社会理论。本期读书会主要介绍以词向量为代表的嵌入模型在计算社会科学领域的一些研究范例,希望这个视角能给大家的研究和工作带来启发。




简介




本期读书会,我们邀请到了斯坦福大学组织行为学博士研究生陈梓文,为大家分享用嵌入模型在社科研究中的应用。在本次分享中,主讲人将介绍什么是嵌入模型、嵌入模型的基本原理与功能、嵌入模型在社科研究中的应用案例、嵌入模型的优缺点等内容。主讲人还会分享嵌入模型相关的论文与工具。本次分享着重于帮助没有接触过嵌入模型以及自然语言处理的听众,希望能够使大家快速理解如何在自己的研究中使用嵌入模型。




大纲




  • 什么是嵌入模型
  • 大数据与计量社会科学
  • 嵌入模型的原理

  • 为什么要用嵌入模型
  • 基础功能
  • 研究案例

  • 总结分析
  • 嵌入模型的优缺点
  • 相关工具与论文‍




主讲人




陈梓文,是斯坦福大学组织行为学博士研究生,主要研究领域是文化与认知、社交网络与计量社会科学。研究目标是使用计算方法(NLP,机器学习,在线实验)研究文化在社群中的建构、传播与演变。

参考文献

Garg, N., Schiebinger, L., Jurafsky, D., & Zou, J. (2018). Word embeddings quantify 100 years of gender and ethnic stereotypes. Proceedings of the National Academy of Sciences of the United States of America, 115(16), E3635–E3644.
Kozlowski, A. C., Taddy, M., & Evans, J. A. (2019). The Geometry of Culture: Analyzing the Meanings of Class through Word Embeddings. American Sociological Review, 84(5), 905–949.
Hofstra, B., Kulkarni, V. V., Munoz-Najar Galvez, S., He, B., Jurafsky, D., & McFarland, D. A. (2020). The Diversity-Innovation Paradox in Science. Proceedings of the National Academy of Sciences of the United States of America, 117(17), 9284–9291.
Mikolov, T., Chen, K., Corrado, G., & Dean, J. (2013). Efficient estimation of word representations in vector space. arXiv Preprint arXiv:1301. 3781.




直播信息




直播时间:
2022年7月2日(周六)上午10:00 - 12:00

参与方式:
  • 集智俱乐部 B 站账号免费直播,扫码可预约:
扫码预约本次直播

  • 若需要观看视频回放,文末扫码付费参加计算社会科学读书会第二季可加入腾讯会议,可提问交流、加入群聊、获取视频回放及更多学习资料,成为计算社会科学社区种子用户,与400余名计算社会科学的一线科研工作者沟通交流,共同推动计算社会科学社区的发展。



计算社会科学读书会第二季招募中


计算社会科学读书会第二季 由清华大学罗家德教授领衔,卡内基梅隆大学、密歇根大学、清华大学、匹兹堡大学的多位博士生联合发起,自2022年6月18日开始,持续10-12周。本季读书将聚焦讨论Graph、Embedding、NLP、Modeling、Data collection等方法及其与社会科学问题的结合,并针对性讨论预测性与解释性、新冠疫情研究等课题。读书会详情及参与方式见文末,欢迎从事相关研究或对计算社会科学感兴趣的朋友参与。




点击“阅读原文”,报名直播

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存