反事实条件句 Counterfactual conditionals(虚拟条件或X标记的)是用来讨论在不同情况下什么为真的的 条件句 conditional sentence。例如:如果彼得相信鬼魂的存在,他就会害怕来到这里。反事实句与指示句形成对比,后者一般只限于讨论开放的可能性。反事实动词的语法特征是使用虚拟时态语法,这种虚拟时态语法与时态和语态等其他语法结合使用。
反事实是哲学逻辑、形式语义学和语言哲学中研究最多的现象之一。它们首先作为条件句的实质条件分析的问题被讨论,条件句把它们都当作是显而易见的事实。
从20世纪60年代开始,哲学家和语言学家发展出现在经典的可能世界方法,在这种方法中,反事实的真理取决于它在某些可能世界中的后果,而这些可能世界的前因是成立的。
最近的形式化分析使用因果模型和动态语义等工具对它们进行了处理。其他研究已经解决了他们的形而上学、心理学和语法基础,同时将一些结果的见解应用到包括历史,市场营销和流行病学领域。
目录
一、概述二、因果模型三、逻辑和语义
四、编者推荐五、百科项目志愿者招募
指示条件句和反事实条件句之间的区别可以用下面的简单例子来说明:
- 指示条件句:如果现在正在下雨,那么Sally 就在里面(If it is raining right now, then Sally is inside)。
一般过去时的反事实:如果现在正在下雨,那么Sally应该在里面(If it was raining right now, then Sally would be inside)。
这些条件句在形式和意义上都不同。指示条件在“如果(if)”和 “那么(then)”两个从句中都使用现在时态is。因此,它传达了这样一种信息:说话人对是否下雨是不可知的。反事实的例句在“如果”从句中使用虚拟时态“was”,在“ then”句中使用情态“ would”。因此,它传达的信息是,说话人并不相信天在下雨。英语还有其他几种语法形式,其含义有时被包括在反事实的范畴内。其中一个是过去完成时的反事实,在使用过去完成时态时,它与指示词和一般完成时的反事实形成对比:- 过去完成时的反事实:如果昨天下了雨,那么Sally当时应该会在里面(If it had been raining yesterday, then Sally would have been inside)。
另一种条件句的用法是“were”,一般称为“非现实(irrealis)”或“虚拟(subjunctive)”。
非现实反事实(Irrealis Counterfactual):如果现在正在下雨,那么Sally应该在里面(If it were raining right now, then Sally would be inside)。
过去完成时和非现实的反事实可以进行条件倒置:
如果下雨的话,Sally就会在里面(Were it raining, Sally would be inside)。
那时如果下雨的话,Sally就会在里面(Had it rained, Sally would be inside)。
术语
“反事实条件(counterfactual conditional)”这一术语被广泛用作上述各类句子的总称。然而,并非所有这类条件句都表达与事实相反的意思。例如,被称为“ Anderson 案例”的经典例子具有反事实条件的典型语法形式,但是并不表明它的前件条件是假的或不可能的。- Anderson案例:如果病人服用了砒霜,他会长出蓝斑(If the patient had taken arsenic, he would have blue spots)。
这种条件句也被广泛地称为虚拟条件句(subjunctive conditionals),尽管这个术语同样被使用者认为是用词不当。许多语言都没有虚拟语气(如丹麦语和荷兰语),许多有从句的语言也不把它用于这种条件句(如法语、斯瓦希里语、所有有从句的印度-雅利安语)。此外,只有将虚拟语气用于此类条件的语言才具有特定的过去虚拟语气形式。因此,虚拟标记既不是必要的,也不是充分的。反事实(counterfactual) and 从句(subjunctive)这两个术语有时被重新用于更具体的用途。例如,不管其语法结构如何,"反事实"这个术语有时被用于表达与事实相反的意思的条件语[14][8]。按照类似的思路,不管其表达的意思如何,"从句"这个术语有时被用于指带有虚拟过去或非现实标记的条件语。最近有研究提出用术语 X-Marked这个词来替代,以概括这些条件语所带有的额外标记。采用这个术语的人把指示性条件语称为O-Marked条件语,反映了它们的o普通标记。
一个条件的 前件(antecedent)有时被称为 "如果"从句或条件子句。条件的结果有时被称为"那么"子句或结论子句。因果模型框架 Causal Models Framework从结构方程(structural equations)Structural Equation Model系统的角度分析反事实。在一个方程系统中,每个变量都被分配了一个值,这个值是系统中其他变量的显式函数。给定这样一个模型,“如果X是X,Y就会是Y(Y would be y had X been x)”这个句子 (形式上为 X = x > Y = y )被定义为断言。如果我们用一个常数X = x取代当前决定 X的方程,并求解变量Y的方程组,得到的解将是Y = y。这个定义已被证明与可能世界语义学的公理兼容,并构成自然科学和社会科学中因果推理的基础。因为这些领域的每个结构方程都对应于一个熟悉的因果机制,这个因果机制可以被研究者进行有意义地推理。这种方法是由Judea Pearl(2000)提出的,作为编码关于因果关系的细粒度直觉的手段,这些直觉在其他提议的系统中难以捕捉。因果模型下的反事实定义
令X和Y是变量集合V中的两个子集,反事实语句“(在情况u下)假如X取x,那么Y可能取到y”可以等价地用数学符号 Yx(u) 来描述,表明变量集Y对X取x的反应。反事实基本定理
等价定理
令 Mx 表示结构方程模型M的修改版本(在关于X的结构方程中用X=x来代替),反事实具备下述等价性质:
一致性定理
若X和Y是观测变量, Yx为反事实变量,以下性质成立:
非确定性模型中反事实的计算
非确定性的因果模型通过对外生变量U赋予概率分布P(U = u)来引入不确定性,从而唯一导致了内生变量V的分布P(V=v)。计算反事实期望 E[Yx=y|E = e] 的步骤为:第一步 归因(Abduction):通过观测证据E=e来计算外生变量的条件分布 P(U | E=e),并用条件分布来估计外生变量的边际分布P(U)。
第二步 行动(Action): 修改模型M,通过将结构方程中关于X的方程替换成X=x,来获得修改后的模型Mx 。
第三步 预策(Prediction): 使用估计的外生变量分布 P(U | E=e) 以及修改模型Mx ,计算Y的期望,即为反事实期望 E[Yx=y | E = e]。
常见的反事实问题模式
治疗组治疗效应ETT
治疗组的治疗效应(effect of treatment on the treated,ETT)被定义为:若存在一组可观测变量Z,且Z是符合X到Y之间后门准则的变量集,则ETT可识别,可用下式对其进行估计:进一步地,若考虑完全线性模型,则可用含有因果效应斜率τ的式子来估计(τ=E[YX+1-YX]):
- ETT=E[Y1-Y0|X=1]=E[Y1|X=1]-E[Y0|X=I]+τ(1-E[Z|X=1])-E[Y|X=1]-τ(0-E[Z|X=1])
归因问题(PN,PS,PNS)
令X=x,Y=y为治疗组,必要性概率(probability of necessity)被定义为:充分性概率(probability of sufficiency)被定义为:必要充分性概率(probability of necessity and sufficiency)被定义为:- PNS=P(x,y) * PN + P(x',y') * PS
定义过剩风险率(Excess Risk Ratio, ERR)为:ERR=(P(y|x)-P(y|x'))/P(y|x),混杂因子(Confounding Factor, CF)为:ERR=P(y|x')-P(y|do(x'))/P(x,y),令 q=P(y'|x)/P(y|x) ,则PN可以由上下界UB、LB来估计:- LB = ERR + CF , UB = ERR + CF + q
- max{ 0, LB}<= PN<=min{ 1, UB }
中介问题
定义总因果效应:TE = E[Y1-Y0] = E[Y|do(T=1)] - E[Y|do(T=0)]。自然直接因果效应:NDE=E[Y1,M0-Y0,M0]=E[Y|do(T=1),M|do(T=0)] - E[Y|do(T=0), M|do(T=0)]]。自然间接因果效应:NIE=E[Y0,M1-Y0,M0]=E[Y|do(T=0),M|do(T=1)] - E[Y|do(T=0), M|do(T=0)]。
经典问题
反事实的问题
根据实质条件的分析,自然语言条件句即“如果p,那么q(if P then Q)”的陈述,只要其前件p为假就是真。由于反事实条件句是那些前置假设的条件句,这种分析会错误地预测所有反事实条件句都是虚假的。Goodman在理解到正在讨论的那块黄油没有被加热的情况下,用下面的一对例子来说明这一点。
更一般地说,这些例子表明反事实不具备真理功能。换句话说,知道前件和结果是否为真并不足以确定反事实本身是否为真。
上下文依赖和含糊不清
反事实是依赖于上下文且含糊不清的。例如,以下任一陈述都可以合理地成立,但不能同时成立:- 如果凯撒(Caesar)当时在朝鲜指挥,他会使用原子弹。
非单调性
反事实是非单调的,因为它们的真值可以通过在其前件中添加额外的信息而改变。这一事实可以通过 Sobel 序列得到说明,例如:- 如果汉娜喝了咖啡,咖啡里有汽油,而汉娜是一个喝汽油的机器人,她会很高兴。
对此事实进行形式化的一种方法是说,前件增强(Antecedent Strengthening)原则不适用于任何旨在作为自然语言条件句形式化的连接词>。
考虑可能存在的世界
反事实的最常见的逻辑解释是 可能世界语义 Possible World Semantics。一般来说,这些方法的共同点是,如果B在A成立的某些可能世界中成立,那么它们就认为反事实 A > B为真。它们的主要区别在于如何确定相关A世界集的方式。大卫·刘易斯(David Lewis)严格可变的条件被认为是哲学中的经典分析。安吉利卡·克拉策(Angelika Kratzer)提出的紧密相关的前提语义常常被视为语言学中的标准。然而,学术上有多可能世界的方法,包括最初被Lewis摒弃的严格条件分析的动态变体。
严格的条件
严格条件分析将自然语言反事实视为等同于模态逻辑公式(P→Q)。在这个公式中,□表示必要性,→被理解为实质条件。这种方法最早是在1912年由C.I. Lewis提出的,作为他对模态逻辑的公理化方法的一部分。- 给定一个模型M= <W,R,V>,对于所有 v使得 Rwv,当且仅当 M, v |= P→Q ,我们有 M,w |=(P →Q) 。
与实质条件不同,严格条件在其前件为假时严格为真。要知道为什么,请观察,如果有一些可能世界v,其中P 为真,Q为假,那么P和□(P→Q) 在 w 处都为假。严格条件也是依赖于上下文的,至少在给定关系语义(或类似的东西)时是如此。在关系框架中,可及性关系是评价的参数,它编码了在上下文中被视为 "活跃"的可能性范围。由于严格条件的真实性可能取决于用来评价它的可及性关系,所以严格条件的这一特征可以用来捕捉上下文的依赖性。严格条件分析遇到了许多已知的问题,特别是单调性。在经典的关系框架中,当使用标准的蕴涵概念时,严格条件是单调的,也就是说,它验证了前件增强。要知道为什么,观察一下,如果P→Q 在每个来自 w 的世界上成立。那么物质条件的单调性保证了P∧R→Q也将是如此。因此,我们将有□(P→Q) |=□(P∧R→Q)。这一事实导致了对严格条件的广泛放弃,特别是支持刘易斯的可变严格分析。然而,随后的工作通过对语境敏感性的诉求恢复了严格条件分析。这种方法是由Warmbrōd(1981)开创的,他认为Sobel序列 并不要求非单调逻辑,而事实上,随着序列的进行,说话人可以切换到更宽松的可及性关系来解释。在他的系统中,像“如果Hannah喝了咖啡,她会很高兴”这样的反事实,通常会用Hannah的咖啡在所有可及世界中不含汽油的模型进行评价。如果这个模型被用来评估随后的“如果汉娜喝了咖啡,而咖啡里有汽油……”的话语,这个第二个条件就会被认为是微不足道的真实,因为没有任何可访问的世界的前件是成立的。Warmbrōd的想法是,说话人将转向一个具有更宽松的可及性关系的模型,以避免这种琐碎性。Kai von Fintel(2001)、Thony Gillies(2007)和Malte Willer(2019)的后续工作在动态语义学的框架内将这一想法正式化,并给出了一些支持的语言学论据。其中一个论点是,条件前置词许可否定性词语,而这些词被认为只能由单调性运算符许可。- 如果Hannah喝了含有汽油的咖啡,她就不会高兴。但如果她喝了咖啡,她就会高兴。
Sarah Moss(2012)和Karen Lewis(2018)对这些论点做出了回应,表明一个版本的可变严格分析可以解释这些模式,并认为这样的解释是可取的,因为它也可以解释明显的例外情况。截至2020年,这一争论在文献中仍在继续,Willer(2019)等人认为,严格条件账户也可以涵盖这些例外情况。可变严格条件
在可变严格方法中,条件A > B的语义是由一些函数给出的,一方面是A为真、B为真的世界,另一方面是A为真、B为假的世界的相对接近程度。在刘易斯的论述中,A > C 是(a)空洞的真实,只有在没有A为真的世界时(例如,如果A在逻辑上或形而上学上是不可能的);(b)非空洞的真实,只有在A为真的世界中,一些C为真的世界比任何C不为真的世界更接近实际世界;或者(c)虚假,在其他世界里。尽管在刘易斯的《反事实》中,他对“接近性(closeness)”的意思并不清晰,但在后来的著作中,刘易斯明确表示,他并不打算将“接近性”的尺度简单地作为我们对整体相似性的普通概念。根据刘易斯的说法,这个陈述的真理在于:在他早餐吃得更多的可能世界中,至少有一个他在上午11点不饿的世界比任何他早餐吃得更多但在上午11点仍然饿的世界更接近我们的世界。过去式作为情态动词的方法,过去时的外延从根本上说不是关于时间的。相反,它是一个未指定的框架,既可以应用于模态内容,也可以应用于时态内容。例如,Iatridou (2000)的特殊过去式作为情态提议,过去式的核心含义是下面的图示:Stalnaker的论述与Lewis的论述最明显的不同在于,他接受了“极限(limit)”和“唯一性假设(uniqueness assumptions)”。唯一性假设的论点是:对于任何前件A,在A为真的可能世界中,有一个最接近实际世界的单一(唯一)世界。极限假设的论点是,对于一个给定的前件A,如果存在一个A为真的可能世界链,每个世界都比它的前一个世界更接近实际世界,那么这个链就有一个极限:一个A为真的可能世界比这个链中的所有世界更接近实际世界。(唯一性假设包含了极限假设,但极限假设并不包含唯一性假设)。根据Stalnaker的观点,当且仅当在最接近A为真的世界中,C为真时,A>C才是非空洞的真。因此,上面的例子是真的,只是在他吃了更多早餐的唯一最接近的世界中,他在上午11点不觉得饿。虽然有争议,但Lewis拒绝了极限假设(因此也拒绝了唯一性假设),因为它排除了这样一种可能性,即可能存在着越来越接近实际世界的世界,而没有极限。例如,可能会有一系列无限的世界,每个世界的咖啡杯都在其实际位置的左边小几分之一英寸,但其中没有一个是唯一最接近的。(参见Lewis 1973: 20)。Stalnaker接受唯一性假设的一个结果是,如果排除中间律是真的,那么公式(A>C)∨(A>¬C)的所有实例都是真的。排他性中间律的论题是:对于所有命题p,p∨¬p都是真的。如果唯一性假设为真,那么对于每一个前件A,都有一个唯一最接近的世界,其中A为真。如果排除中间法则是真的,任何结果C在A为真的那个世界里要么是真,要么是假。所以对于每一个反事实A>C,要么A>C,要么A>¬C为真。这就是所谓的条件排除中间法(CEM)。- (2) 如果公平的硬币被抛出,它将会反面朝上(即不是正面朝上)。
根据Stalnaker的分析,存在一个最接近的世界,在这个世界里,(1)和(2)中提到的公平的硬币被抛出,硬币要么正面朝上,要么反面朝上。因此,要么(1)是真,(2)是假,要么(1)是假,(2)是真。然而,根据Lewis的分析,(1)和(2)都是假的,因为公平的硬币正面朝上的世界并不比反面朝上的世界更接近或更远离。对Lewis来说,“如果硬币被抛出,它将正面朝上或反面朝上”是真的,但这并不意味着“如果硬币被抛出,它将落在正面”,或“如果硬币被抛出,它就会反面朝上”。其他考虑
信念修正
在信念修正框架中,反事实是用 Ramsey检验的形式化实现来处理的。在这些系统中,当且仅当在当前的知识体系添加 A后得到的结果是B时,反事实A > B成立。这个条件将反事实条件与信念修正联系起来,因为对A > B的评价可以通过首先用A修正当前的知识,然后检查B在什么结果中是否为真。当A与当前的信念一致时,修正是很容易的,但在其他情况下可能会很难。每一个用于信念修正的语义都可以用于评价条件语句。反过来说,每一种评价条件语句的方法都可以被看作是一种执行修正的方法。Ginsberg
Ginsberg(1986)提出了一种条件句的语义,它假定当前的信念形成了一组命题公式,考虑这些公式中与A一致的最大集合,并在每个集合中加入A。其理由是,这些最大集合中的每一个都代表了一种可能的信念状态,在这种状态下,A为真,且与原始状态尽可能相似。因此,当且仅当B在所有这些集合中都为真时,条件陈述句A > B才成立。书籍推荐
连接统计学、机器学习与自动推理的新兴交叉领域——因果科学读书会再起航
关于因果的讨论很多,但是许多入门的教材只是为没有统计学基础的读者介绍如何使用统计学技术处理因果性问题,而没有讨论因果模型和因果参数,本书希望协助具有基础统计学知识的教师和学生应对几乎在所有自然科学和社会科学非试验研究中存在的因果性问题。本书聚焦于用简单和自然的方法定义因果参数,并且说明在观察研究中,哪些假设对于估计参数是必要的。我们也证明这些假设可以用显而易见的数学形式描述出来,也可以用简单的数学工具将这些假设转化为量化的因果关系,如治疗效果和政策干预,以确定其可检测的内在关系。- Counterfactuals and Causal Inference: Methods and Principles for Social Research
课程推荐
因果推断与机器学习领域的结合已经吸引了越来越多来自学界业界的关注,为深入探讨、普及推广因果科学议题,智源社区携手集智俱乐部将举办第二季「因果科学与CausalAI读书会」。本季读书会着力于实操性、基础性,将带领大家精读因果科学方向两本非常受广泛认可的入门教材。1. Pearl, Judea, Madelyn Glymour, and Nicholas P. Jewell. Causal inference in statistics: A primer. John Wiley & Sons, 2016.(本书中译版《统计因果推理入门(翻译版)》已由高等教育出版社出版)2. Peters, Jonas, Dominik Janzing, and Bernhard Schölkopf. Elements of causal inference: foundations and learning algorithms. The MIT Press, 2017.相关论文推荐
- Wei, Tianxin, et al. "Model-Agnostic Counterfactual Reasoning for Eliminating Popularity Bias in Recommender System."
- Kusner, Matt J., et al. "Counterfactual fairness."
- Johansson, Fredrik, Uri Shalit, and David Sontag. "Learning representations for counterfactual inference."
- Hartford, Jason, et al. "Deep IV: A flexible approach for counterfactual prediction."
- Goyal, Yash, et al. "Counterfactual visual explanations."
- Russell, Christopher, et al. "When worlds collide: integrating different counterfactual assumptions in fairness."
- Foerster, Jakob, et al. "Counterfactual multi-agent policy gradients."
- Dash, Saloni, Vineeth N. Balasubramanian, and Amit Sharma. "Evaluating and Mitigating Bias in Image Classifiers: A Causal Perspective Using Counterfactuals."
作为集智百科项目团队的成员,本文内容由Wei用户参与编译,Chancychen参与审校,思无涯咿呀咿呀编辑。我们也为每位作者和志愿者准备了专属简介和个人集智百科主页,更多信息可以访问其集智百科个人主页。
以上内容都是我们做这项目的起点,作为来自不同学科和领域的志愿者,我们建立起一个有效的百科团队,分配有审校、翻译、编辑、宣传等工作。我们秉持:知识从我而来,问题到我为止的信念,认真负责编撰每一个词条。
在这里从复杂性知识出发与伙伴同行,同时我们希望有更多志愿者加入这个团队,使百科词条内容得到扩充,并为每位志愿者提供相应奖励与资源,建立个人主页与贡献记录,使其能够继续探索复杂世界。
如果你有意参与更加系统精细的分工,扫描二维码填写报名表,我们期待你的加入!
点击“阅读原文”,阅读反事实词条原文与参考文献