四周四讲!浙大李昂然老师暑期班《量化社科研究方法:从基础操作到前沿实战》
文/高行云
首发时间:2021年7月19日
社会学的三大传统顶尖期刊,是哪些?
American Journal of Sociology
American Sociological Review
Social Forces
这些顶刊里的研究,都有什么特点呢?
《美国社会学家》(The American Sociologist)期刊2018年发表过一篇文章,统计了这三大刊物的特点。分析方法是这样的:
* 以1950~2010年为限,抽样得到182篇
* 看看到底哪些主题词,被这些论文提到、又有什么样的次数变化。
结果是下面这两张图:
第一张图的词汇,都和我们的研究方法密切相关(圆圈大小代表出现次数多少)。
我们能清楚地看到,1950-2010年代的美国社会学顶尖刊物的变化
1. 以结构、系统分析为代表的老派研究(如结构功能论)在衰落。
2. 以模型分析,在1970s年代开始稳步出现,持续产生影响
3. 具有量化特点的“数据”、“效应”等词汇也在日益彰显。
确实,自1970年代以来,美国社会学的顶尖刊物越来越量化。究竟量化怎么做呢?
当这份研究再以主题聚类(thematic cluster)分析,可以看到“分析、证据和假设”(analysis, evidence,hypotheses)三个关键词的聚类,在这几十年来日益强盛,这说明了社会学研究方法越来越强调假设与证据间分析验证。
我们不妨再看看另一份研究,来自康奈尔大学的社会学教授Richard Swedberg在2018年发表的一份研究:究竟“变量”(variable)在社会学刊物中如何扩散和主流化?
变量,往往和量化社会学密切相关,不管是测量还是模型。Swedberg发现,从1950年代起,“变量”一词在《美国社会学评论》论文出现的频率越来越高。1990年代以来,基本上有至少75%的论文,必须会在论文中出现“变量”一词。
既然这方面已经如何主流。可以想象的是:
不会量化、不懂量化,已经很难看懂多数英文社会学期刊论文。
不信?
试试看2021年最新一期《美国社会学评论》,共有6篇论文,多数和量化有关。
第1篇 The Political Contextand Infant Health in the United States
* 这篇论文是用固定效应模型(fixed-effects model)的量化研究
第2篇 How Legacies of Geopolitical Trauma Shape Popular Nationalism Today
* 这篇政治社会学研究,是运用了最新的“地缘政治威胁量表”的量化研究
第3篇Marriage and Masculinity: Male-Bread winner Culture, Unemployment, and Separation Risk in 29 Countries
* 这篇性别与婚姻研究,是用了29个国家的面板数据分析。
甚至,还有一篇是专门谈量化方法的文章——“What Is Your Estimand?”
那么,也许你会想:我做定性,就不用管量化的。
我也这么想过,但还是在读研究生的时候,老老实实花了两个学期好好学习量化方法。尤其是当我自己研究质性和历史方法,会更加觉得是离不开——欣赏、理解与运作量化思维。
实际上,定性研究越来越借鉴量化研究的思维。不妨来看两个例子:
1. 定性研究也开始思考量化研究的数据库做法
我在之前推送中说过一份研究,来自哈佛大学的质性研究专家Mary Waters的最新论文。她以自己数十年的研究经历说明,质性研究不再是Small-N研究,而越来越是访谈大规模的人群、尤其变得需要团队协作、复制复核的研究,因此为了便于质性编码,反而要像量化研究一样重视数据库(访谈材料)的规范建设和数据管理。而这方面,正是量化研究的长期传统。
2. 定性研究能够从量化方法中提升研究的严谨性
正如我在之前推送中说过一份研究:如何将量化的“半实验”或“断点回归”,运用到质性研究中去,提升观察与验证的准确性。
纽约大学社会学系教授Gianpaolo Baiocchi研究的是巴西的参与式预算,出版过一本扎实的田野调查专著《Bootstrapping Democracy:Transforming Local Governance and Civil Society in Brazil》。他想研究的是:在投票选举的代议制民主下,如何推动具有参与式民主色彩的“参与式预算”
难题是:如果证明公共服务等方面的变化,是来自于参与式预算的改革,而不是来自于其它因素呢?
这非常难!哪个社会现象不是多种原因影响的?Baiocchi教授很聪明,他的研究设计非常量化——“断点回归”。断点回归的意思是这样:假设你和你同学的家庭背景等因素都一样,但就是你考了499分,你同学考了500分,而那一年的“一本线”就是500分,所以你没有上大学、你同学上了。这个“一本线”是个断点,能够在控制其它因素相同的情况下,区分你和你同学后来的变化(如薪酬)是如何受到这个因素的影响。
因此,Baiocchi教授大大违背了定性研究者的期望:没有挑选“典型”城市,而是以“配对分析”的方式,分别挑选了三对的一般的城市。他还量化计算了这些城市的选举得票率。在每一对中,一个城市是工人党都是以2%左右微弱优势上台(断点所在),实行参与式预算,而另一个城市中工人党是类似的微弱劣势输了选举,没有实行参与式预算。他还评估了每一对城市的工业化水平、城市化水平、教育水平等方面的一致性。
简单地讲,Baiocchi教授的质性研究的设计,是量化思维,是断点回归式的配对分析,而那个断点就是“工人党微弱优势上台/弱势下台=实行/没有实行参与式预算”。如此一来,他就能够分析,每一对的城市都非常类似,唯一不同的就是有没有实行参与式预算。
这是用量化思维做质性研究的非常精彩的案例!
话说回来,究竟量化分析,怎么做?进一步,量化社会科学方法,怎么学呢?
“Sociological理论大缸”邀请了浙江大学社会学系“百人计划”研究员、康涅狄格大学社会学博士李昂然老师,开设了新一期的暑期班——《量化社科研究方法:从基础操作到前沿实战》,时间是7月30日—8月20日每周五晚。
2021年6月,李昂然老师受邀作为“Sociological理论大缸”创办的《社会理论青年说》第6讲主讲人,分享过《鸡娃之困:社会学视野下家庭教育的理性思考》,引起很多同学的强烈关注。800多名老师和同学参与了讲座,也发现对社会问题的思考,不仅只停留在想当然的道德批判或案例故事,而是要从跨国比较、历时比较的多重数据,说明到底现在“鸡娃”是不是中国特例?为什么鸡娃(或者说教育的父母参与程度)是和一个国家的社会不平等、高等教育扩张等程度之间存在密切关系的。归根结底,能够理性与比较地用数据说话,正是因为李昂然老师一直专攻教育社会学、社会阶层与不平等的量化研究,也曾在英文期刊 Sociology of Education, Social Science Research, and Chinese SociologicalReview等多有发表。
2021年7月初,我再次邀请了李昂然老师来分享了《社科研究设计与量化分析》,主要说一说他研究“鸡娃”等议题的量化数据处理中,会涉及到的基础议题,比如:
* 如何测量概念:当我们说“文化资本”的时候,到底指的是哪些指标?为什么是这些指标?
* 如何选择正确的模型:为什么数据结构、反事实框架等都会影响模型选择,而不是直接拿过来就跑回归?
* 以及如何谨防定量分析的陷阱
正值暑期,所以想邀请李昂然老师能够趁这段时间,更加系统地分析。毕竟之前的两小时的讲座,远远不够介绍量化分析的整个体系,尤其是不容易和实战实例操作结合起来。
因此,浙江大学李昂然老师的《量化社科研究方法:从基础操作到前沿实战》暑期班,希望以四周四讲的方式,帮助有兴趣做量化研究、有兴趣了解量化方法的同学,从基础操作到前沿实战,更加体系化和实例化地学习。
关于几个常见问题,可见页底了解:
1. 报名李昂然老师的量化方法暑期班,有专业限制吗?
2. 学完了这门课,就会做量化吗?
3. 李老师的的量化方法暑期班,有何不同之处?
说明:参与学员需已经安装统计软件Stata。
(该海报可扫码报名)
1 课程大纲
第一讲:系统入门统计软件Stata
内容介绍:
第1讲全面系统地介绍统计分析软件Stata在社会科学研究中的实际操作和应用,帮助统计知识零基础的同学,从实操的角度快速入门,帮助建立该软件的整体框架与运作逻辑。主要内容包括:
* Stata用户操作界面介绍和编程语言的使用,尤其是do file和log file的使用。
* 基础的变量处理编程知识,特别是变量创建、修改、赋值标签等。
* 数据库构建编程知识,包括数据合并和结构转换。
Stata软件安装说明:https://www.stata.com
阅读材料:
Cox, Nicholas J. “A Brief History of Stata on its 20th Anniversary.” The Stata Journal 5, no. 1 (2005): 2-18.
Acock, Alan. A Gentle Introduction to Stata. Stata Press: College Station, TX.
朱顺泉编著,《Stata数据分析应用》,北京大学出版社。
第二讲:数据处理流程
内容介绍:
第2讲详细介绍社科定量分析中的数据处理流程和注意事项,包括以下三个部分:
* 数据管理:数据清理需要遵循什么原则?如何清理变量?缺失数据如何处理?如何选择正确的数据结构进行分析?
* 模型设定:如何根据研究文献、研究设计和数据特征进行模型设定?模型设定需要注意的问题有哪些?
* 数据可视化:如何更有效地使用图像呈现分析结果?数据可视化需要遵循什么原则?
实例展示:
通过研究复制分析,向大家展示定量研究数据清理分析的具体过程。分析案例:
Li, Angran(李昂然). “Unfulfilled Promise of Educational Meritocracy? Academic Ability and China’s Urban-rural Gap in Accessto Higher Education.” Chinese Sociological Review 51, no. 2(2019): 115-146.
阅读材料:
Long, Scott. The Workflow of Data Analysis Using Stata (Third Edition).Stata Press: College Station, TX.
中文译本:唐丽娜,王卫东译,《基于Stata的数据分析流程》,中国人民大学出版社。
第三讲:线性回归
内容介绍:
第3讲介绍线性回归模型的知识框架和其在社科研究中的应用,并探讨线性回归模型假定和研究设计之间的关系,重点内容包括:
* 线性回归六个基本假定。
* 线性模型估计方法。
* 模型拟合优度。
* 假设检验(模型整体检验、回归系统检验)。
* 中介效应和交互效应。
实例展示:
通过研究复制分析,向大家展示线性回归分析的具体过程。分析案例:
Hanushek, Eric A., and Ludger Woessmann.“Knowledge Capital, Growth, and the East Asian Miracle.” Science 351,no. 6271 (2016): 344-345.
阅读材料:
谢宇,2013,《回归分析》,社会科学文献出版社。
第四讲:定量分析前沿之因果推断
内容介绍:
第4讲介绍社科定量分析的前沿议题-因果推断,并反思当下因果推断分析面临的问题和困境。主要内容包括:
* 如何从随机实验设计和反事实角度去思考分析观察类数据?
* 热点因果推断分析方法介绍:双重差分,断点回归,双重稳健。
* 反思因果推断存在的问题
阅读材料:
王天夫,社会研究中的因果分析,《社会学研究》,2006第4期:132-156.
陈云松,范晓光,社会学定量分析中的内生性问题——测估社会互动的因果效应研究综述,《社会》,2010第4期:91-117.
胡安宁,2015,《社会科学因果推断的理论基础》,社会科学文献出版社。
Elwert, Felix, and Christopher Winship. “Endogenous Selection Bias: The Problem of Conditioning on a Collider Variable.” AnnualReview of Sociology 40 (2014): 31-53.
Nichols, Austin. “Causal Inference with Observational Data.” The Stata Journal 7, no. 4 (2007): 507-541.
延伸学习文献推荐
课程结束后,主讲老师会提供精心筛选的、回归分析实例学习的文献30篇
1. 提出经典贡献,适合巩固学习的文献10篇
2. 研究设计完善,适合模仿学习的文献5篇
3. 提供原始数据,适合复制学习的文献5篇
4. 结合前沿方法,适合延伸学习的文献5篇
5. 结合新兴议题,适合反思学习的文献5篇
2 授课时间
四周四讲
2021年7月30日—8月20日
每周五19:00—21:00(北京时间)
3 授课形式
(1)网络授课
本课程为网络授课,共4讲,合计8小时/480分钟。每讲2小时/120分钟,包括: 量化方法讲解、作业评点展示、实例操作示范、前沿解读讲解
(2)课前提问
学生在每周开课前在班级的“石墨文档”中填写自己对该周学习内容的疑惑。每次主讲人会在讲课时回答。
(3)回放有效期
150天
4 往期讲座学员的交流和反馈
5 参与课程,三个要点
1. 报名李昂然老师的量化方法暑期班,有专业限制吗?
2. 学完了这门课,就会做量化吗?
3. 李老师的的量化方法暑期班,有何不同之处?
6 导师介绍
李昂然
* 浙江大学社会学系百人计划研究员
* 美国康涅狄格大学社会学博士
* 研究兴趣:社会分层与流动、教育社会学、家庭社会学、以及定量研究方法
* 研究发表于Sociology of Education,Social Science Research,Chinese Sociological Review等SSCI期刊。
* 注重关注在教育资源市场化背景下,家庭学校教育与代际流动的关系及其对教育公平的影响。
*代表论文包括:
Hamlin,Daniel, and Angran Li. 2019. “The Relationship between Parent Volunteering in School and School Safety in Disadvantaged Urban Neighborhoods.”Journal of School Violence
Li,Angran, MichaelWallace, and Allen Hyde. 2019. “Degrees of Inequality: The Great Recession and the College Earnings Premium in U.S. Metropolitan Areas.” Social ScienceResearch 84:102342.
Li, Angran, andDaniel Hamlin. 2019. “Is Daily Parental Help with Homework Helpful? Reanalyzing National Data Using a Propensity Score-based Approach.” Sociology ofEducation 92(4):367-85.
Li,Angran. 2019.“Unfulfilled Promise of Educational Meritocracy? Academic Ability and China’s Urban-Rural Gap in Access to Higher Education.” Chinese Sociological Review51(2):115-46.
Obach,Heidi, Angran Li, and Simon Cheng (equal authorship). 2018. “Boys,Girls, and the Second Shift: Paid and Unpaid Labor in High School and Adolescents’ Enrollment in College.” Social Currents 5(2):173-92.
Li, Angran, and MaryJ. Fischer. 2017. “Advantaged/Disadvantaged School Neighborhoods, Parental Networks, and Parental Involvement at Elementary School.” Sociology of Education 90(4):355-77.
7 报名方式
* 报名费:498元人民币
* 点击文末“阅读原文”,或下图的二维码,进入在微师平台上购买和观看直播;
* 在购课平台上,点击“联系方式展示”添加课堂助手的微信,或者直接添加微信ID sunyufan1991;
* 以订单支付凭证,进入课程交流群。
李老师往期讲座纪要:
“鸡娃”社会学六十年:统计数据与理论演进(社会理论青年说第6讲)