查看原文
其他

Nature特刊:计算社会科学研究的数据百宝箱

集智俱乐部 集智俱乐部 2022-11-29


导语


在这个算法「统治」生活、数据高速积累的年代,社会经济系统尤其呈现出复杂性,各种大数据方法和跨学科研究纷纷在「计算社会科学」领域交汇。Nature杂志7月以封面文章的形式发布了「计算社会科学」特刊,针对计算社会科学当前面对的问题和正在兴起的数据方法,进行了梳理介绍。本文是对特刊文章的简介。


研究领域:计算社会科学,人类行为数据,算法伦理,数据度量,社会感知

郭瑞东 | 整理

梁金 | 审校

邓一雪 | 编辑



特刊链接:https://www.nature.com/collections/cadaddgige


      



1. 使用在线数据

来研究人类行为的威力与危险




文章题目:

The powers and perils of using digital data to understand human behaviour

文章地址:https://www.nature.com/articles/d41586-021-01736-y


该文指出计算社会科学在最近几年取得了巨大成功。但力量越大,可以带来的危害也越大,应该承担的责任也随之增大。研究大型数据集的研究人员必须避免仅从数据中看到趋势或模式就得出结论,而应考虑可能影响结果的因素,考虑广泛使用的算法背后的假设是否仍然适用于当前研究领域。通过跨学科协作,可以避免常见疏漏,从而更好地利用已有知识。



2. 数字足迹由每个人自己决定

而不是由科技公司决定




文章题目:

Everyone should decide how their digital data are used — not just tech companies文章地址:https://www.nature.com/articles/d41586-021-01812-3

智能手机、可穿戴设备、购买和浏览偏好,可以反映社会的很多信息。然而这些数据是如何被创造出来、如何被使用,却由极少数人决定。政府及公共服务行业应该建立数字网络上的公共基础设施,从私有企业那里拿回数据的控制权,并扩展监管的范围。而计算社会科学也需要在守护对我们自身和所处社会的认识上,发挥重要的作用。




3. 增加供应链的多样性,

可应对食物冲击




文章题目:

Supply chain diversity buffers cities against food shocks

文章地址:https://www.nature.com/articles/s41586-021-03621-0

全球气候变暖、自然灾害或是新冠危机,都可能冲击食物的供应链。Nature 最近的论文“供应链多样性为城市在面对食物短缺的冲击时提供缓冲”,基于美国2012-2015年间的数据,借用了生态学中的多样性指标来构建模型。研究指出提升城市食物供应链的多样性,可以提升15%城市面对中等强度食品短缺的能力。通过这一简单的模型,可以评估那些能够扩大供应链多样性的政策,将如何提升城市面对食物冲击时的抵抗力。




4. 整合计算社会科学中的解释和预测




文章题目:

Integrating explanation and prediction in computational social science

文章地址:https://www.nature.com/articles/s41586-021-03659-0

计算社会科学不仅仅是用数据描述社会现象,解释和预测也很重要。具体而言计算社会科学研究可以分为四类,分别对应:描述一个现象,检验一个因果关系的断言,检验是否具有预测能力,以及检验一个论断是否能用于预测并具有预测效能。面对新研究时,应确定研究属于哪一类,这能够让我们判断该研究的价值何在。

科研人员应选择这四类中尚待挖掘的课题,并判断其能否经受因果关系检测;还可以提出既具有预测能力,也具有解释性的新研究方法。而政策制定者要鼓励对预测模型进行公开的验证,同时提供标准数据集,来作为解释性模型的验证性数据框架。




5. 21世纪人类社会的有意义度量




文章题目:

Meaningful measures of human society in the twenty-first century

文章地址https://www.nature.com/articles/s41586-021-03660-7

我们能够测量的有多少,科学的进展就有多少。今天观察到的行为比二十世纪末所能想象到的要多得多。我们的人际沟通、运动和许多日常行为,都可能被用于科学研究;其中很多还来自事后的追溯。如何从并非为特定研究目的而收集或创建的数据中找出意义,是计算社会科学亟待解决的问题。如何构建出新的度量方式,既能够指导数据的收集或第三方数据的使用,也能够指出哪些数据可以用来检测验证或探索的任务,是重要的前沿课题。
               
观测指标构建在计算社会科学研究流程中的作用




6. 在算法深度介入的社会中

进行有效观察




文章题目:

Measuring algorithmically infused societies

文章地址:https://www.nature.com/articles/s41586-021-03666-1

当社会的结构由人和算法共同塑造,也就是“被算法侵染的社会”开始出现时,会产生三个关键挑战:测量质量不足、(错误) 测量引发的复杂后果(连锁反应),以及现有社会理论的局限性。为此我们需要将数据和测量结合到理论建设中的新方法。考虑到测量可以应用的规模,我们相信测量模型应该是可信的、可审计的和公正的。为了实现这一目标,观测方法应该是透明的,并可进行互动参与,包括确保观测质量和查明可能的危害的机制。我们认为,计算社会科学家需要重新思考,应该观测被算法侵染的社会的哪些方,应该如何衡量它们,以及这样可能带来的后果

       
算法对社会的影响及对其的研究




7. 清楚地思考流行病传播的社会方面




文章题目:

Thinking clearly about social aspects of infectious disease transmission

文章地址:

https://www.nature.com/articles/s41586-021-03694-x


人类流行病传播的几乎每个方面,包括我们衡量、理解和应对流行病的能力,都受到社会和文化力量的塑造。病原菌的直接传播,依赖于人与人之间的接触。亲属关系、家庭和社会结构都会塑造接触模式,而这反过来又决定了流行过程的动力学
 
该文讨论了如何将局部获取的知识整合到模型框架的设计和对新数据流的解释中,为公共卫生决策提供与政策相关的模型的可能性,还讨论如何提出与流行病相关的人类行为的稳健、可泛化的理论。利用新的数据流和局部知识来阐明疾病传播的社会方面,将能够对流行病进行更准确的建模和预测。




8. 人类社会感知是

计算社会科学尚未开发的资源




文章题目:

Human social sensing is an untapped resource for computational social science

文章地址:https://www.nature.com/articles/s41586-021-03649-2

尽管人们普遍认为认知偏见影响了我们对周围人的评价,但研究表明,作为高度社会化的生物,我们人类非常善于评估周围的人,也就是具有“社会感知”。感知社会环境的能力,从而理解他人的想法和行为,使人类能够融入自己的社会世界,沟通和合作,并从他人的经验中学习。

由于计算社会科学的出现,社会感知能力可以用来推进对人类社会性的研究。研究人员可以通过询问一个人的社交圈,而不是询问他们自己,来收集有关社会趋势和群体的高度准确的信息此外,他们关于如何体验社会世界的报告可以帮助建立受人类社会经验约束的社会动力学模型。
 
 
该专辑还推荐了10篇去年的研究论文/新闻稿中,集智俱乐部曾解读报道过其中4篇,如下:


复杂科学最新论文


集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。扫描下方二维码即可一键订阅:



推荐阅读



点击“阅读原文”,追踪复杂科学顶刊论文

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存