查看原文
其他

Annual Review新文编译 | 社会学顶刊(ASR等)中的计算社会科学都做些什么?

The following article is from 政治小志 Author 理论志编辑部

社会学顶刊(ASR等)中的计算社会科学都做些什么?

本期简介:随着信息技术的发展,计算社会科学这个交叉学科正在蓬勃发展。本文回顾了七个社会学中使用大数据的研究领域,并对未来的研究方向提出见解。对计算社会学感兴趣的读者,可以重点关注本文的参考文献,均是社会科学、自然科学领域的顶级期刊(如Science、Nature、PNAS,ASR)中的高被引论文,有助于更加深入了解该领域的现状,也希望该文能够启发读者在计算社会科学理论发展上有更多的想法,谨以此以飨读者。


文献来源Edelman A, Wolff T, Montagne D, Bail C A. (2020). Computational social science and sociology. Annual Review of Sociology. 46: 61-81.

Annual Review of Sociology


社会网络和群体形成

使用传统问卷调查的方法研究社会关系存在诸多限制,现在研究者可以从互联网、社交媒体平台和远程通讯等中获得数据,从而推动该领域的发展。例如Watts采用电子邮件数据证实了数字空间中存在七度分隔、网络动态均衡和意见领袖的现象。同样的,Macy采用电子通信数据证实了网络的多样性与经济发现存在强关联。最近的研究使用电子数据检验社会网络中行为扩散现象。


例如Centola创造了一个在线社区,形成了几个不同社会网络类型的社区。研究结果发现,健康行为的扩散更有可能到达社会网络紧密聚集的个人中,而非社会网络随机组织的个体中。社交媒体和通信数据能够研究前所未有的大规模社交网络。例如Park等人采用Twitter和国际手机通话数据研究了极端长距离的社会关系。他们的发现挑战了长期以来人们所持有的观点,即远距离的群体中的个体之间的社会关系是弱连接(例如是基于陌生人而非亲密朋友),但是他们的研究发现,远距离的网络连结同样也可以很强。


另外一类研究是研究网络游戏中的动态网络,例如研究在线游戏中的集体智慧和政治信念。Guilbeault等人的研究发现,在匿名环境下,多样的政治群组能够更加准确的测量政治事实,但一旦其他人知道了彼此的政治认同,这种测量的准确性就有所下降。


集体行为和政治社会学


计算社会科学同样启发了不少关于集体行为和政治社会学的研究。推特等社交媒体平台成为了该领域研究的重点对象,因为平台提供了大量的数据用来研究信息如何通过社交网络传播。不少研究发现线上和线下的社会运动之间存在强相关,但也有研究发现在线的支持者对运动的付出和承诺低于实地的运动参与者。即使这些在线的数据无法捕捉到线下过程的全貌,但是他们也是对传统数据的补充。关于社交媒体如何影响社会运动的读者,可以参见此篇编译。


Annual Review新文|社交媒体如何影响社会运动

 

除此之外,还有大量关于政治话语的研究。例如Bail等人通过研究在离散场域中行动者的位置和语言中的情感,证实了边缘话语如何进入主流话语。其他的研究则关心政治话语如何与政策变化之间进行互动。Flore等人从推特上抓取的文本中分析发现,反对移民的法律如何加深了公众舆论对移民的反对。 


最后,许多研究使用在线数据、自动化的文本分析、实验、主体仿真等方法检验政治极化和劝服。这些研究检验政治部落的形成以及回音室如何让用户选择性接触某些信息。计算社会学家采用实验研究党派偏见如何改变个人的信念。例如当让用户接触与自己观点相反的信息时,有可能会产生反效果。Bail等人让Twitter用户关注一些账号,这些账号会向用户发送与自己政治观点相反的信息,结果发现这并没有消除政治观点极化,反而加深了个人对自己观点的偏见。


知识社会学


计算社会科学已经成为知识社会学中的重要方法,其中一个分支的研究是采用引文数据研究科学领域的共识是如何形成的。Bruggeman等人的研究显示,区分表示同意的引用和表示不同意的引用的重要性。通过模拟,他们发现一小部分有争议的引用对引文网络是否表明一致意见有重大影响。


现在大规模的文献著录数据的收集和分析变得更加容易,学者们可以从整体描绘和模拟科学场域的形成过程。芝加哥大学的“元知识”项目主要从事这方面的研究,他们团队关注目前科研中团队合作占据主流的现象。例如Wuchty等人的研究发现,在社会科学领域,团队工作在过去的五十年中增加了一倍多。同时,研究发现,小团队的研究倾向于引介科技领域中新颖的和有颠覆性的观点,而大团队的研究倾向于拓展和深化已有的观点。文本分析技术的进步有助于让学者们揭示不同学科之间的相似处与差异处。


另一个分支的研究则检验学术研究是如何获得影响力和声誉的。Uzzi等人的研究发现高影响力的学术作品尽管建立在前人的工作之上,但是同时也包含了很多新奇和不寻常。在社会学领域,Leahey等人的研究发现,如果一篇论文横跨了多个领域则更有可能获得更多被引数,且更有可能出现在顶级期刊中。Ma等人通过对世界范围内学术获奖者的调查中发现,相对较小的一部分获奖者推动了科学的边界,剩下的学者则集中在科学精英的小圈子里。


计算科学同样也同样发现,个体科学家的选择和组织情境会影响科学研究。Rzhetsky等人确定了生物医学科学家在选择要研究的分子之间的关系时所遵循的策略,他们发现这些选择反映了他们在职业生涯所作出的选择,同时发表失败的经历也可以促进科学研究的发现。最后,计算科学同样也关注科学如何与产业进行互动,以及科学领域内的性别不平等现象。


文化社会学、社会心理学和情绪


计算社会科学也出现在文化社会学、社会心理学和情感的研究中。在文化社会学中,一些研究考察了文化变迁的过程。Bail确定了提出了离散场域的“承载能力”概念:如果信息策略涵盖了不同的主题范围,则会吸引更多的关注,但包含太多主题的信息的影响力就会小一些。Kozlowski等人使用单词嵌入来研究随着时间的推移,美国和英国中与阶级和性别相关的术语的意义发生了大规模的变化。 
文本数据的激增也开拓了关于文化信息如何被表达的研究。大部分的研究从脸书或推特中收集数据。例如研究发现了脸书中的公共健康讨论中存在情绪传染的现象,同时用户接触到有情绪的语言会让用户自己变得更情绪化,且更有可能与含有情绪的内容产生互动。这些研究有助于增进关于大脑进行“冷”和“热”的信息加工的讨论,同时也解释了社会情境如何塑造的表达风格,并如何随着时间的推移在社交网络中传播。 
除了采用文本分析外,不少前沿的学者采用虚拟现实(AR)进一步探究社会心理学中的核心问题。例如van Loon等人要求学生参加一项合作任务,但是其中有一半人随机进入处理组,他们使用虚拟现实并要求他们进行换位思考的练习。这项干预措施能够有效的提升个体的亲社会行为。尽管虚拟现实技术在心理学中比较常用,但是社会学接受新技术较慢。这一点比较令人惊讶,不仅仅因为AR技术有助于研究人们在精密控制的实验环境下的反应,而且社会学的最早期研究也聚焦在虚拟社群中。


文化生产


计算社会科学通常研究人们如何评价文化产品,例如音乐、艺术或者电影。在一项非常有影响力的研究中,Salganik等人创造了一个线上的“音乐实验室”研究同辈影响如何塑造个人对于音乐的偏好。在实验中,被试要求对一些不太知名的乐队打分。在控制组中,被试没有任何关于乐队流行度的信息,在处理组中被试则知道这些乐队音乐的下载量。研究发现,处理组的被试更愿意听高下载量的歌曲,而且对这些歌曲的评价更积极。 
同样,计算社会可以也研究文化产品中主题组合如何影响产品的接受度。Askin等人采用美国音乐公告牌和Spotify的数据,研究发现表现最好的音乐听起来和榜单上去年的音乐类似,但又在主题等不同方面存在小幅度的变化。 
另一项研究考察了个人之间的社交网络如何塑造文化产品的创造,即文化产品的新颖性和创新性。例如,de Vaan等人使用一个大型的视频游戏制作积分数据库来证明,跨领域的开发团队创造出的产品更有创意,也更受欢迎。Rossman等人通过对好莱坞演员网络的分析,展示了身份地位是如何在一起工作的人们之间转移的。在这种情况下,如果一个演员和一个地位很高的演员一起出现在电影中,他就更有可能获得奥斯卡提名。最后,最近的研究也关注性别、阶级、政治身份如何影响文化产品的生产。


经济社会学与组织学


计算方法和网络方法的交叉也在经济社会学中蓬勃发展。电子邮件和即时通讯档案创建了组织中个人的大型动态网络,这是对自我报告产生的数据的重大改进。个人和组织之间的早期交流,例如,医院之间的患者转移塑造了社会网络的演变和资源分配。短信数据还允许研究人员衡量员工在经济决策中的协调水平,并表明同步沟通会增加交易的盈利能力。最后,网络数据改善了对社会资本和职业结果的研究。
除了网络数据外,数字化的文本通信记录还提供了对文化和情感在市场中的作用的更丰富的理解。利用文本分析,研究揭示了市场波动如何影响交易者是在讨论当前还是未来的状况,以及这些转变如何塑造交易行为。其他研究表明,在与其他员工的沟通中表现出适度情绪水平的个体,会进行最有利的股票交易。最后,Schnable将定性方法与自动文本分析相结合,研究宗教如何为草根NGO提供文化框架,使其能够宣称合法性,建立社会网络,并获得资金和资源。


人口学


计算社会科学在人口学中出现的时间相对较晚,但它正迅速流行起来。计算方法最常用于产生高质量的人口估计。例如,手机数据被用于产生更动态的人口估计,或者使用谷歌街视图和深度学习来估计社区的人口统计学特征,用众包技术来测量社交媒体人口统计学,网站用来绘制大规模系谱树,以及在线图像数据来预测年龄。计算方法也正在开发,为了研究生育率和死亡率,研究采用了谷歌搜索数据和Facebook数据。其他研究使用来自Twitter和LinkedIn的数据对国家内部和国家之间的移民做出更准确的估计。 
人口统计学家也使用计算方法来探索人口过程的微观动力学,如约会和婚姻。最近的几项研究使用了来自一个大型网络约会平台的数据,研究人际关系是如何跨越种族和民族差异形成的。Lewis发现了网络约会中种族通婚的有力证据,但也表明,如果人们被陌生人邀请约会,对方来自其他种族或民族,他们更有可能去约会。

计算社会科学研究也用来研究对社会有害的健康行为。例如,Kashyap & Villavicencio使用谷歌搜索数据来研究印度选择性堕胎的流行情况。Bail等人使用谷歌搜索数据来研究人口因素对暴力激进化的影响。Araujo等人利用Facebook的广告工具追踪了47个国家生活方式疾病的流行情况。其他研究利用这些相同的数据重新探讨人口统计学中关于移民、生育率和性别隔离的核心问题。


总结:用计算科学的方法建构人类行为的新理论


本文的综述表明社会学家不仅为计算社会科学贡献了新的方法,而且也取得了重大的理论进展,这是该领域继续扩展到主流社会学的关键。通过计算社会科学,有多种方法可以取得理论进展。

首先,许多研究使用新的类型数据和方法,改进了曾经认为无法研究的传统社会学议题,例如宏观层面的社会网络和文化变迁。但是更重要的是,想要产生有影响力的研究需要连接宏观理论(如文化变迁)和微观层面的行为决策。

其次,计算社会科学也需要发现新的理论,尤其是数字技术发展本身创造的新的理论。这些新的理论包括:数字抗争、文化产品消费、在线知识扩散等。但现在很多新的社会学理论并没有跟上数字技术的发展,最明显的例子是AI、机器学习等重塑了我们去其他人的交流方式,这有可能形成新的社会隔离,并重塑我们的社会网络发展。

最后,社会学家可以使用计算社会科学的工具来开发创造新方法。我们可以系统地使用机器学习等工具来识别社会行为的新维度,或测试我们现有描述的稳健性。最自然的做法可能是比较这些模型所产生的预测与潜在现实之间的差距,或者是逐个变量地比较,或者是系统地测试不同变量的排列组合如何使我们能够发现人类行为中不可预见的复杂性,或者是找出我们的盲点。最后,学者们也在通过与其他领域的对接来创造理论。例如,比较人类行为、计算和人工智能的理论,开启了关于社会生活本质的令人兴奋的新探究路线。将这一理论发展路线发挥到极致,我们还可以准确地比较人工智能和人类智能之间的差异如何帮助我们对社会过程形成更深层次的理解,尤其是那些不容易表达或机器可能难以观察到的过程。


编译 | 元   兔

审核 | 华堂门生


-- PoliticalReview --

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存