查看原文
其他

社会计算驱动的社会科学方法 | 计算社会科学读书会收官直播

集智俱乐部 集智俱乐部 2022-10-15


导语


经过了三个多月的学习和讨论,计算社会科学读书会迎来了收官分享,读书会的最后两期,邀请到罗家德老师及其博士生高馨、杨虎老师,通过周末两个晚上的分享,为我们介绍大数据研究的探索与验证的整合、大数据与结构化数据整合下的探索与验证研究案例、中国风险投资的联合投资行为建模与思考等话题。内容干活较多,安排了两个晚上的时间,分为上下两场,时间分别是本周六(9月24日)晚上的20:00-22:00和周日(9月25日)晚上的20:00-22:00,文末扫码预约直播。






上半场:

大数据与结构化数据整合下的探索

与验证研究




(时间:9月24日晚上20:00-22:00)


背景

霍夫曼(Jake Hofman)与瓦茨(Duncan Watts)等人于2021年在《自然》杂志上发文,依据可解释性和预测性将计算社会科学的研究方法划分到四个象限中:一、描述性统计;二、因果研究;三、预测模型与预测因子分析;四、因果与预测整合性研究。其中,霍夫曼和瓦茨重点强调了可解释和预测性结合的研究的重要性。本次读书会将首先对计算社会科学研究几种典型研究范式做进一步梳理,介绍如何使用不同来源的数据、不同方法、对话相关理论形成完整研究。在此基础上,重点介绍如何整合大数据和结构化数据进行探索与验证结合的研究案例,针对在企业中的团队如何提高创新的研究议题,整合文本数据、网络数据与人力资源结构化数据,使用自然语言处理技术、社会网络分析方法、机器学习模型、可解释AI模型、传统计量回归进行先探索和后验证的整合性研究。


分享内容与计算社会科学读书会之间的关系

基于本次读书会基于以往关于计算社会网络的计算、自然语言处理等方法的介绍,本期将主要从方法论角度讲述如何组合这些不同的方法、对话社会科学理论来形成完整研究,对融合大数据方法和社会科学理论的几种典型研究范式做阶段性的总结。具体描述如何结合大数据与传统问卷数据或结构化数据做出探索、验证、探索与验证结合的研究,同时辅以具体案例的展示。


分享内容与复杂系统之间的关系

数据及其分析方法的出现推动了社会科学与计算融合的研究新范式的涌现,基于大数据,运用统计力学、动态建模和人工智能等方法和技术,来获得对社会现象和规律更精准的刻画,并提出科学解释。本次读书会将对这些范式做出阶段性总结,重点介绍融合组织研究情境下,如何整合文本、网络大数据与人力资源结构化数据的探索与验证的结合研究,具体研究问题是基于知识和网络视角下组织中团队的创新的研究。


主要涉及到的知识概念

  • 大数据;
  • 研究方法论;
  • 探索性和验证性结合研究;
  • 组织团队创新


分享简介

社会科学家一般多关注因果和解释性问题,计算机学家旨在提升预测模型准确率。而随着计算社会科学等交叉学科的兴起,关于“预测性和可解释性不再是权衡和竞争,而是可以相互补充”的呼吁逐渐得到重视。本次读书会将从方法论角度做出梳理,旨在针对这一领域研究范式,针对具体的研究问题,阐述如何处理和整合对应的社会科学理论、新数据和新方法来获得新发现、验证或修正理论,从而形成完整的研究。其中,重点介绍大数据与结构化数据或调查数据结合下如何开展探索性、验证性、探索性和验证性整合的研究案例。


分享大纲

第一部分:融合大数据与社会科学理论的研究范式
第二部分:案例展示

2.1 大数据与调查数据结合的探索性研究--人脉研究

2.2 大数据与结构化数据结合的验证性研究--组织中的圈子与结构洞对员工绩效的影响

2.3 大数据与结构化数据结合的探索性与验证性研究--知识多样性和网络结构如何预测团队创新


主讲人

罗家德,清华大学社科学院社会科学院与公共管理学院合聘教授、博导, 清华大学社会网络研究中心主任 ,清华大学计算社会科学与国家治理实验室社会学组PI ,Journal of Social Computing主编。

研究领域:圈子理论研究、自组织研究、社区营造研究、组织社会资本研究、外包体系治理问题、高科技产业集群、组织设计与交易成本分析、经济社会学、社会网络理论、社会网络分析、网络动态学与仿真模型。


高馨,清华大学社会学系博士生在读,研究方向为计算社会学,社会网络和组织行为研究,主要研究内容为使用大数据与结构化数据的结合,进行以理论导引的社会计算领域的探索性和验证性研究,主要研究主题包括中国人的人脉研究、组织行为、组织绩效以及团队创新研究。目前已发表论文于《社会学研究》、《管理科学学报》、《Journal of Social Computing》、《Journal of Air Transport Management》等期刊。


主持人

王硕,中国人民大学网络与移动数据管理管理实验室博士,现为河北大学数学与科学学院数据科学系讲师,中国人工智能学会社会计算与社会智能专委会会员。

目前研究领域为自然语言处理、机器学习、数据科学、知识融合等,参与完成多项国家重大研究重点支持计划或重点研发项目,发表关于情绪心理学与知识融合方面的论文多篇。





下半场:

中国风险投资的联合投资行为建模与思考




(时间:9月25日晚上20:00-22:00)

背景

新一代信息技术的发展令记录系统运行的大量数据成为可能,系统层面的演化和其内部个体间的交互变得易于观测和度量(汪寿阳 et al., 2021)。互联网中充斥着大量非结构化数据,这些数据记录了中国风险投资市场的社会经济活动,描述了创业企业与风险投资机构、创业企业之间、风险投资机构之间、创业企业与其他企业或部门之间的一系列互动行为。用复杂网络描述企业间的互动过程并辅以节点属性,是一种以系统观视角解决上述挑战的方案。研究证明,复杂网络建模有助于我们挖掘以往面板数据所不能发现的规律。例如:利用高频股票交易网络来刻画高频交易行为(Musciotto et al., 2021);通过金融交易网络识别有害交易节点(Sreedharan et al., 2019)等都佐证了系统观视角的优势。


分享内容与计算社会科学读书会之间的关系

现实系统中存在多种实体,他们之间关系存在异质性、多样化、多变性等特点,本次读书会将重点从统计建模、数据挖掘的视角来研究市场的复杂交互活动,并结合管理理论来解释这些社会现象,并贯穿案例,以帮助大家更深入了解方法和理论之间的对话关系。


分享内容与计算社会科学读书会之间的关系

本次读书会不仅用复杂网络建模揭示中国风险投资的联合投资关系形成的动因,还从复杂网络视角对风险投资机构、圈层结构、社团关系及异质性联合投资等多尺度网络特征建模,解决风险投资建模过程中节点关系和特征异质性带来的统计分析问题,并根据研究对象构建不同分析模型,最终用于解释多尺度网络特征与风险投资机构投资绩效和创业企业退出绩效之间的关系。


主要涉及到的知识概念

  • 联合投资网络;
  • 社会地位;
  • 圈层结构;
  • 社团关系;
  • 投资绩效;
  • 图模型;
  • 图神经网络;


分享简介

主要介绍复杂管理问题的统计建模,解释中国风险投资的联合投资关系形成的动因,风险投资机构、圈层结构、社团关系及异质性联合投资等多尺度网络特征测量与建模,多尺度网络特征与风险投资机构投资绩效和创业企业退出绩效之间的关系。


分享大纲

1. 联合投资行为建模

2. 风险投资领袖识别

3. 风险投资的圈层结构识别

4. 风险投资的社团发现

5. 风险投资的投资绩效

6. 复杂系统的涌现现象--VC联盟行为与结构共演

7. 总结


主讲人

罗家德,清华大学社科学院社会科学院与公共管理学院合聘教授、博导, 清华大学社会网络研究中心主任 ,清华大学计算社会科学与国家治理实验室社会学组PI ,Journal of Social Computing主编。

研究领域:圈子理论研究、自组织研究、社区营造研究、组织社会资本研究、外包体系治理问题、高科技产业集群、组织设计与交易成本分析、经济社会学、社会网络理论、社会网络分析、网络动态学与仿真模型。


杨虎,中央财经大学信息学院副教授,中国人工智能学会社会计算与社会智能专业委员会委员、中国医疗保健国际交流促进会中医药质量优化分会委员,中国计算机学会会员,运筹学和管理学研究协会(INFORMS)会员。先后在丹麦奥胡斯大学公共卫生学院、美国明尼苏达大学生物统计系、日本北海道大学访学创成研究机构访学。主要研究方向为:大数据分析与统计计算、社会计算、复杂网络分析、数据挖掘。目前承担了国家自然科学基金青年基金、统计局重点研究项目等课题,有丰富的科研和教学经验。已在《Statistics in Medicine》、《Information Processing & Management》、《Computational Statistics and Data Analysis》、《Communications in Statistics-Simulation and Computation》、《Journal of Computational Biology》等国内外知名期刊发表学术成果。目前担任《Information Processing & Management》、《International Journal of Information Management》、《International Journal of Production Research》、《Journal of Social Computing》、《系统科学理论与实践》等国内外期刊与学术会议审稿人。


主持人


方宏波,卡内基梅隆大学计算社会科学博士,主要研究方向是人与人之间的沟通、合作和在社交媒体上的行为模式。对社交网络,社区及社群的群体行为,科学学等都有广泛的兴趣。


参考文献

  • 周涛,高馨*,罗家德,2022, 《计算社会推动的研究方法》,《社会学研究》第5期。

  • 罗家德,高馨*,周涛、刘黎春、傅晓明、刘知远、苏与松,2021,《大数据与结构化数据整合的方法论——以中国人脉圈研究为例》,《社会学研究》第2期。

  • M. J. Salganik, S. Vazire, A. Vespignani & T. Yarkoni 2021, “Integrating Explanation and Prediction in Computational Social Science.” Nature 595.

  • Salganik, M. J. 2017, Bit by Bit: Social Research in the Digital Age. Princeton: Princeton University Press.

  • Hofman, J.M., Watts, D.J., Athey, S., Garip, F., Griffiths, T.L., Kleinberg, J., Margetts, H., Mullainathan, S., Salganik, M.J., Vazire, S. and Vespignani, A., 2021. Integrating explanation and prediction in computational social science. Nature, 595(7866), pp.181-188.

  • Agrawal, Mayank, Joshua C. Peterson, and Thomas L. Griffiths. 2020. Scaling up Psychology via Scientific Regret Minimization. Proceedings of the National Academy of Sciences of the United States of America 117 (16): 8825–35.

  • Peterson, J.C., Bourgin, D.D., Agrawal, M., Reichman, D. and Griffiths, T.L., 2021. Using large-scale experiments and machine learning to discover theories of human decision-making. Science, 372(6547), pp.1209-1214.

  • Mitchell, Gregory. 2004. "Case Studies, Counterfactuals, and Causal Explanations." University of Pennsylvania Law Review 152 (5): 1517–1608.

  • Freese, Jeremy, and David Peterson. n.d. "Replication in Social Science." Annu. Rev. Sociol. 2017. 43:147–65

  • King, Gary. 1995. "Replication, Replication." PS, Political Science & Politics 28 (3): 444–52.





直播信息




直播时间:

  • 2022年9月24-25日(周六、周日)  

    • 9月24日 晚上 20:00-22:00

    • 9月25日 晚上 20:00-22:00


参与方式:

  • 集智俱乐部 B 站账号免费直播,扫码可预约:
扫码预约本次直播
  • 若需要观看视频回放,文末扫码付费参加计算社会科学读书会第二季可加入腾讯会议,可提问交流、加入群聊、获取视频回放及更多学习资料,成为计算社会科学社区种子用户,与450余名计算社会科学的一线科研工作者沟通交流,共同推动计算社会科学社区的发展。



计算社会科学读书会第二季招募中


计算社会科学读书会第二季由清华大学罗家德教授领衔,卡内基梅隆大学、密歇根大学、清华大学、匹兹堡大学的多位博士生联合发起,自2022年6月18日开始,持续10-12周。本季读书将聚焦讨论Graph、Embedding、NLP、Modeling、Data collection等方法及其与社会科学问题的结合,并针对性讨论预测性与解释性、新冠疫情研究等课题。读书会详情及参与方式见文末,欢迎从事相关研究或对计算社会科学感兴趣的朋友参与。



推荐阅读
用图表示数据和图的可视化 | 周六直播·计算社会科学读书会直播
PNAS论文作者解读:科研团队扁平化与科学创新丨周六直播·计算社会科学读书会
嵌入 (embedding) 方法介绍以及在社科领域的应用 | 周六直播·计算社会科学读书会
嵌入(embedding)方法与隐藏的关系空间 | 周六直播·计算社会科学读书会直播
从手工编码到大规模文本分析:自然语言处理在计算社会科学中的应用 | 周日直播·计算社会科学读书会

大语言模型和社会科学研究:效率与趣味 | 周六直播·计算社会科学读书会

人类移动的性质及其应用:以可持续交通为例 | 周六直播·计算社会科学读书会
利用移动数据研究COVID-19的传播和防控 | 周六直播·计算社会科学读书会
圆桌论坛:计算社会科学的分析与建模方法 | 周四直播·计算社会科学读书会

点击“阅读原文”,报名直播

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存