统计计量 | 如何确定因果关系?四种理论分析模型
本文转载自公众号DataGo数据狗
作者:Capt.贺(来自豆瓣)
来源:https://www.douban.com/note/722899551/
《Stuff Happens: Understanding Causation in Policy and Strategy》里面提出了判断因果关系的四种思维模型,很有借鉴意义。我简单翻译编辑了下。
第一种,规律-概率视角(regularity and probability view)
在RPV(即规律-概率视角的缩写)当中,主要是考虑与经验一致的因果关系。比如,低气压的现象往往在下雨之前发生,因此,我们可以推断:低气压是下雨的原因。纯粹从形式上来看,这种关于因果关系的描述确定了两个事实之间的一种连接方式。模式辨识,特别是关于高度一致关系的辨识,是我们大部分学习活动的基础。
当然,并非所有的规律性关系都是因果联系。然而,这些概然的统计关系是许多关于因果关系的洞察活动的基础。借助这种概率形式,RPV能够找到潜在的充分原因,而不是必然原因。
由于在因果分析方法上的价值很高,RPV在指标确定和预测判断上、在实施初步项目评估上、在猜想深层因果机制的假设上都很有用。随着我们获得数据、提高计算能力的成本降低,RPV既经济又快速。
RPV的另外一个长处,同时也是缺陷,就是虽然RPV不能很好地解释我们观察到的概率联系,我们仍然可以通过它来确定描述指标和预测指标。许多变量之间的联系具有欺骗性,也就是说我们观察到的强联系源自于偶然性因素,比如有些球迷就会认为他们穿什么T恤与他们球队是否获胜之间存在联系。
RPV的第二个缺点是它高度依赖于经验:它没有任何关于深谋远虑的因素,而且是所有因果视角工具中,适应新情况最慢的。经验通常是对未来观察的一个优秀的预测指标,但当它不具备预测能力的时候,运用它可能会带来深远的、灾难性的误导。比如,2008年美国发生的金融危机。
第二种,反事实思考视角:如果不是……
通过反事实思考这个透光镜,我们将原因视为“起作用”的事件。对比来看,RPV通过原因和结果之间的常态联系来确定因果联系,反事实思考完全聚焦于原因和结果之间的必然联系。我们通过三种方式来确定反事实的原因:物理实验、统计分析、思想实验
前面两个是基于经验的,而最后一个完全是推导性的。如果聪明地应用实验手段,可以给领导者提供关于因果假定的即时信息,给领导者一个检验新想法的机制,而且不用将整个阻止卷入其中。领导者应该对实验敞开怀抱,视其为战略发展变化的核心要素。当实验条件不具备的时候,我们可以用精密的统计工具来解释非实验的、观察到的数据,以便说明如果做了实验,样本中会发生什么事情?
当然,反事实思考也有它的局限性:
第一,反事实思考在识别必要原因时极好,但这些必要原因并非是哪些最关键的原因。仅仅是必然性不足以识别策略形成中关键杠杆因素。“如果X国没有人,那么就没有叛乱发生”这个命题显然是正确的,但对我们思考对策是没有任何用的。“有人”是“叛乱”的必要条件,但并非充分条件。
第二,通过反事实思考列出的清单可能特别长。
第三,反思是思考提出了“优先占位”的问题。为了证明X是Y的一个必要原因,我们必须假定如果排除了X,那么不会有另外一个必然原因导致Y的发生。比如,如果我今天因为开车超速被拦停,导致了上班迟到,那么“被拦停”就是“起作用”的事件。但是,假设恰好因为我被拦停,所以我避免了一场交通事故,而这个交通事故也会导致我迟到。那么,在这个例子中,“被拦停”就优先抢占了“交通事故”的位置。按照这个逻辑,一个原因必然优先抢占另一个原因的位置。那么,问题在于,如果我们排除了其中一个原因X,那么Y必然不会发生吗?
在这种背景下,反事实思考用在时空接近的场合判断原因会更有效。
第三,物理主义视角
物理主义聚焦于在某个过程之中,将原因直接与结果相连,并想办法理解连接它们的机制。这种视角帮助我们识别那些可以使我们破坏某项进程的点位。比如,某地发生了IED事件,物理主义主要关注的是制造的过程、放置地点以及引发方法等等。这种视角把制定策略的注意力放在组成系统的要素上,这些要素或者阻碍系统的成功,或者促进系统的成功。
在这种观察下,深层的因果机制可以通过还原分析的方法找到。当我们将一个系统分解成某些行为体的小集合、某些分系统以及它们之间的相互连接,我们就采取的是物理主义的视角。
但是,物理主义视角也有明显的局限性:
第一,由物理主义视角所展现出来的因果关系,极容易陷入“始料未及后果定律”的泥潭。物理主义认为,介入因果的行为应该在时间和空间上距离原因特别近,并且它鼓励人们采取收缩关注点的方法。这种方法可能会导致人们忽视由介入行为所引发的、在系统其他地方产生的副作用。物理主义缺乏一种格式塔式的整体观,在寻找可能存在的副作用时不是很有用。同时,将某个系统简化为一组因果交互关系,可能会模糊系统上更高层次的特点。就是我们通常所说的:“一叶障目、不见森林”。
第二,物理主义视角强调强有力的、一针见血的介入方法,这种介入方法可能会把我们的注意力和资源从已有的、互补性的手段上引开。比如,我们会过多关于使用技术手段解决社会问题。
第三,物理主义视角无法分析由于缺乏某种东西而产生的问题。有些事情的发生不是因为有了什么,而是因为缺了什么。比如,18世纪时在水手里产生的坏血病,医生一开始认为是食物中毒或者蚊虫叮咬,但实际上是缺乏维生素C。
最后,物理主义视角无法辨别系统中涌现现象产生的因果关系。宏观系统中的行为,如金融危机恐慌或者大规模游行,是无法通过还原论方法得出有效性解释的。
物理主义视角是非常重要的,它将复杂的、变化的系统简化为一系列的组成部分以及部分之间的相互联系,并且允许我们通过操控系统的组成与结构来中断、改变或促成某种系统行为。
第四种,特质倾向(disposition)视角:发现隐藏原因
与上述方法不同,特质倾向视角的方法是从远距离来看原因产生,并且考虑原因是如何变成结果的。这个视角来看原因时,主要考虑在某个特定背景下实体所具有的细节、特点、能力以及脆弱性。比如,用这个视角去分析,发生森林大火的原因是干燥,埃博拉疫情爆发的原因是缺乏有效的公共健康保障。假设我们在讨论X国内战爆发的原因。如果你的解释中包含了国家的民族、宗教、语言多样性以及财富和权利的不平衡分配等,那么你们就在使用特质倾向视角的因果研究方法。
大部分的特质倾向性原因都建立在基于经验和抽象理性的推断上。比如,性格和文化,在社会系统中都是不可观察的。
当然,这种方法也由局限性。第一,特质倾向视角让考虑了许多因果关系,我们会在讨论那些根本产生影响的原因上耗费太多时间。第二,强调不可观测的原因会引发关于具体化的问题,比如,性格可能是很多行为的原因,但是专家花费了很长时间争论它的定义是什么。
关于应用
正确的问题比错误的解释更具有价值。所以,提供了一个策略性的工具箱:
规律-概率视角:哪些在时空上接近结果的因素被规律性地观察到?
反事实思考视角:系统中排除哪个因素可以避免某种结果的产生,或者促使另外结果的产生?
物理主义视角:哪些关键因素集合是与重要事件在那里发生、什么时间发生以及怎样发生联系最紧密的?
特质倾向视角:如果我们想要促使某个我们想要的结果发生,或者抑制某个我们不想要的结果发生,哪些积极的、潜在的,个体的、集体的倾向可以促使或抑制结果的发生?
介入方式:在多大程度上,我们可以操控那些我们已经发现的因果关系?
介入方式:计算出现错误的概率有多大,结果是什么?
点击搜索你感兴趣的内容吧
往期推荐
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
推荐 | 马纯菲
欢迎扫描👇二维码添加关注