查看原文
其他

书声 | 社会远观:人文社科的大数据视野

商南 社会理论 2024-04-23

《社会远观:人文社科的大数据视野》书影

陈云松 著,商务印书馆,2021年

本书详细介绍了大数据的人文社科应用领域与成果,从社会、经济、文化、政治、历史等多种角度立体展示了在大数据协助下的“社会远观”工作,也即从大历史纵深、大空间跨度的视野,通过海量数据来观察、展示和分析宏观社会过程与人文现象。本书的内容,既是对人文社科研究对象与方法的重建,也是对长期以来基于个体层面的定量研究理论意识弱化、宏观思路缺乏的反思和修正,更为当代公众提供了一个全新的、以往无法想象的了解、传播和思考宏观时空尺度上的社会现象、文化过程的重要平台。

导言

第一章  人文社科大数据

第一节  大数据概述

第二节  人文社科视野

第三节  大数据来源


第二章 大数据的功能

第一节  透视当代社会:从性少数人群说起

第二节  重现宏大历史:中国瓷塔和全球城市

第三节  揭秘文化脉络:文化标志大排名

第四节  澄清社会事实:女性刻板印象和脏话

第五节  呈现复杂现象:人文社科的合作网

第六节  提供文本远读:李子柒、特朗普与东北喊麦


第三章 大数据的信息维度

第一节  时间趋势信息

第二节  空间差异信息

第三节  时空变化信息

第四节  网络互动信息


四章 大数据中的社会结构和变迁

第一节  美国社会的阶级意识

第二节  中国社会结构话语

第三节  互联网的观念割席

第四节  焦虑、抑郁与环境


第五章 大数据中的文化脉络

第一节  百年三地电影里的中国

第二节  小说的传播效应

第三节  代内文化反授

第四节  文化景观的学问


第六章 大数据中的社会治理和发展

第一节  微博与中国股市

第二节  外商投资与国际知名度

第三节  “一带一路”倡议的沿线关注度


第七章 大数据和社会学的学科发展

第一节  大数据中的百年群学

第二节  传统定量研究的微观旨趣

第三节  宏观定量社会研究何以可能


附录

参考文献





文/陈云松


社会学研究社会情境如何影响人们的思想与行动。由于人们在社会关系中组成规模、层次不同的群体,社会学研究自然有宏观、微观等多个聚焦层面,既关注社会群体现象和过程的广泛宏大的特征,又关注个体或小型群体的理性与非理性的社会行为。


虽然宏观层面的研究一直是社会学的核心领域之一,且深深根植于诸如马克思、涂尔干等人物的奠基之作中,但当代定量社会学研究的主导视角过于聚焦微观层面,形成了研究取径上的微观旨趣。重要的是,即便从定量研究的角度,我们也必须承认,社会情境和群体的差异性,是任何一种社会学都需要检视的核心问题。社会现象、社会关系和社会过程,如制度、法律、文化、经济等都是宏观层面的社会属性而非个人属性,也往往无法通过基于个体层次的微观分析而得到观测和分析。在这个意义上,当代定量社会学作为社会科学的维度完整性存在重要的缺憾,而这种缺憾直接影响了定量研究对于社会学学科的总体贡献和社会影响力,也引发了学界从多个角度和层面对定量研究的批评和质疑。尽管定量社会学研究者深谙统计模型、抽样样本的应用条件和局限并在持续反思中不断加以改进,但从本体论和研究层次、研究方向的角度进行的反思并不多见。本章希望能借助新一轮更底层的反思,坚定地推动定量社会学研究走向更为广阔的天地,承担起更为重要的学科和社会使命。


Le suicide : étude de sociologie, by Émile Durkheim,1897


社会学具有宏大理论的范式源头和植根理论的优秀传统,只是与之相比,在宏观层面获取社会指标和有效数据,长久以来成为实证研究的软肋。更重要的是,本体论整体主义的社会主体含糊性,使得几十年来定量研究者总是有意无意地回避宏观层次的实证分析,遑论区群谬误从20世纪60年代开始就让宏观分析看起来似乎是定量研究的雷区。不过,当社会学家可以获得和驾驭海量的大数据时,覆在这一学科隐痛上的“陈年纱布”终于可以被揭开,并从此处发展且焕发出强大的生命力。大数据对定量研究的贡献在于——空前的信息时空覆盖范围和复杂程度,使得传统调查问卷等方法所不能测量的宏观社会学指标和复杂系统特征,都逐渐能够被学者所挖掘和利用。结合大数据和计算社会科学的方法,我们能对宏观社会现象和过程进行结构展示、规律发现、实证研究和实验模拟。


区群谬误(Ecological fallacy)最先见于 William S. Robinson在1950年的文章 Ecological Correlations and the Behavior of Individuals。在1930年美国人口普查结果中,Robinson分析了48个州的识字率以及新移民人口比例的关系。他发现两者之间的相关系数为0.53,即代表若一个州的新移民比率愈高,平均来说这个州的识字率便愈高。但当分析个体资料时,便发现相关系数便是-0.11,即平均来说新移民比本地人的识字率低。出现这种看似矛盾的结果,其实是因为新移民都倾向在识字率较高的州份定居。


我们清楚,仅凭大数据本身或者复杂炫目的计算方法和模型,是远远不能从社会学意义的角度来充分利用这些数据的。因此,我们倡导新型数据和技术的应用,但更呼吁定量学者应该更有力、更深度地传承和扎根社会学的理论传统。同时我们也知道,仅凭社会学理论的丰富想象力或个人灵感,亦不足以在数字化的大时代展开真正有时代想象力和历史贡献的社会研究。社会学家必须拥抱新的宏观转向,但这种转向是理论、数据和治理三元驱动的高度统一,是一种理论导向宏观定量社会学。它的新生、发展和成熟,非但不会损害社会学的伟大传统也即永恒的主题——理论想象力和批判性思维,而且会为这一伟大传统提供更为扎实的巨量的实证基础,以及更有力的方法论武器。


此外,这一转向还具有本体论与认识论意义:如果我们改变了信息来源,改变了分析工具,那么我们也改变了社会学知识的对象。这样的改变使社会学在社会科学的环境中更可靠,在学术界之外更具影响力。因此,尽管宏观转向本身是缓慢和艰难的,大数据分析中固有的数据协议和门槛,无论是对于优秀的定量学者还是杰出的理论家而言,都是同样陌生而充满挑战的,但这不能成为我们拒绝转向、放弃大数据和计算社会学的理由。我们必须抵制自满与保守的领域道统意识,不能停留在20世纪晚期数据、方法、理论之间关系割裂的时代。相反,我们必须认识到,定量社会学的宏观转向,其最大潜力不在于它使用数据的庞大,而在于它能革命性地解放社会学思维与想象力,最大限度地促进对社会过程、社会环境的理解和对国家建设、社会建设的贡献。


“大数据之‘大’,首先表现为数据量大,包括采集、存储和计算的量都非常大;其次表现为来源广泛和类型多样,包括互联网数据、科研数据、传感数据、商业数据等多个方面。”——陈云松


我们还要强调的是,宏观定量社会学的发展,在中国具有得天独厚的优势和重要的多维价值。中国拥有14亿人口、数十亿互联网用户接口与数据,在经济金融、娱乐游戏、物流服务等方面的移动数据客户端使用普及程度,远远超过西方;而巨大的幅员使得中国各地区的经济、社会、文化发展存在巨大的异质性。在百年未有之大变局中,中国的海量数据和社会异质性,既对研究者提出更多的大理论挑战,也为研究者观察、透视宏观信息提供了更多的战略机遇。习近平总书记对于哲学社会科学中的量化研究方法使用给予了充分的肯定:“对现代社会科学积累的有益知识体系,运用的模型推演、数量分析等有效手段,我们也可以用,而且应该好好用。”从社会学定量研究宏观转向的角度,我们认为,中国宏观定量社会学从微观旨趣走向宏观观照的过程,体现了社会学人对如何“好好用”的自觉思考与探索,且必将能对社会学学科发展和中国哲学社会科学的话语体系建成,起到深远的关键作用。





本文节选自陈云松《社会远观:人文社科的大数据视野》,商务印书馆,2021年,第400—403页。



编辑 | 张 喆

审核 | 陈烨广


书声|《反思与自反:反身性视野下的社会学与风险社会》

书声 | 《中国人口问题》

书声 | 《巨变时代的社会理论:名家访谈录》


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存