查看原文
其他

老姚专栏丨假设检验的经济学

姚耀军 杨奇明 数据Seminar 2021-06-03

本文2209个字,细读大约需要8分钟


科学研究是去伪存真的过程,假设检验则是实现这一过程的基本方法。经济效率是决定制度安排的底层逻辑。有趣的是,假设检验中关于原假设与备择假设的设定,亦符合效率原则。简单来说,原假设与备择假设的设定要使得举证反驳即证伪的成本最小化,而这就是假设检验的经济学。



#01

应把证伪成本较低的假说设为原假设

举一个例子,设想人们在一个巨大的房间里活动后,发现身上有些瘙痒。于是有人提出一个假说:“房间里有跳蚤”。若对这一假说进行统计检验,则存在如下两种假设体系设定方式:

设定一:原假设为“房间里有跳蚤”,当然备择假设就是“房间里没有跳蚤”。如果要用证据反驳原假设,那么你可能须把房间的每一个微小角落都仔细搜寻一遍。道理很简单,在某一个角落未发现跳蚤,并不意味着其他角落没有跳蚤。极端一点地说,举证反驳的成本如此之大,以致“房间里有跳蚤”根本无法被反驳。

设定二:原假设为“房间里没有跳蚤”,备择假设就是“房间里有跳蚤”。与设定一相比,如果你要反驳“房间里没有跳蚤”就简单得多,因为从任何一个角落发现跳蚤,就有力地驳倒了对方。

上面这个例子表明,为了节省举证反驳的成本,那些更容易被证据驳倒的命题应该被设定为原假设,就如同一个靶子竖立在那里。现实中,一个靶子被竖立起来,往往是用来被打破的,以显示你枪法如神。同样,原假设也是被故意树立起来,用来推翻或者打败,从而反证备择假设正确性的——之所以能反证,是因为从形式上看,原假设与备择假设构成了一个非此即彼的完备假设体系。




#02

“不拒绝”原假设不等于“接受”原假设

既然原假设相对来说更容易被证据驳倒,那么我们不妨将原假设这个靶子更形象地称为稻草人。是的,打败一个稻草人原本是容易的,但若原本容易被打败的稻草人竟然未被打败,亦即容易被证伪的原假设竟然未被证伪,那么这意味着什么呢?说明至少面对当前的证据,作为原假设的稻草人是足够坚强的,是与证据相容的。这反过来说明,备择假设缺乏有力的证据支持
那么,面对当前的证据,作为原假设的稻草人足够坚强而未被打败,是否就意味着原假设被证实,从而我们应该“接受”原假设呢?答案是否定的。正如在上例中,一个角落未发现跳蚤,并不意味着其他角落没有跳蚤。因此,人们在某个角落未发现跳蚤,并不能证实“房间里没有跳蚤”这一原假设。既然当前的证据没有证实原假设,那么我们怎能轻言“接受”原假设呢?故正确的说法是“不拒绝”原假设,而不是“接受”原假设
“不拒绝”原假设当然也透露出一丝我们心有不甘的味道,毕竟我们试图证实的备择假设(即“房间里有跳蚤”)目前缺乏有力的证据支持。然而,前文的分析表明,这里的心有不甘其实是一种理性的反应。接下来,从备择假设这个角度,我们来再次阐释这一点。



#03

“不拒绝”原假设并不证明备择假设为假

必须当心,我们不能将“备择假设缺乏证据支持”误解为“备择假设被证明为假”。英谚曰——

Absence of evidence is not evidence of absence.

说的正是这个理。在这句英谚中,“Absence of evidence”是指“证据的缺乏”,更具体地说,就是“某个假说缺乏证据支持”;“evidence of absence”是指“缺乏的证据”。我们不妨将此处的“缺乏”理解为“某个假说为假”,那么“缺乏的证据”具体是指“能够证明某个命题为假的证据”。

回到本文的例子,“房间里有跳蚤”作为备择假设没有得到证据支持,仅意味着我们目前还没有在房间里找到一只跳蚤,并不意味着房间里真的没有跳蚤,备择假设“房间里有跳蚤”就是错误的命题。因此,我们不说“接受”原假设从而否定备择假设,而说“不拒绝”原假设,这样就为备择假设可能为真留下了余地。
总而言之,如果连稻草人般的原假设都未被“打败”,那么我们只能遗憾地表示,现有证据对备择假设的支持实在太弱了。但我们不认为,现有证据已经推翻了备择假设。换言之,“不拒绝”原假设并不证明备择假设为假。
一个具有启发性的问题是,既然我们真正在乎的是备择假设,那么在原假设未被拒绝从而备择假设未获得证据支持的情况下,我们接下来该做点什么呢?基本思路有二:第一,进行更多的搜寻,亦即增加样本容量;第二,不妨考虑跳蚤是否对某种物质(比如气味)比较敏感,进而开发出一种诱捕器,并观察房间里的跳蚤诱捕器是否捕捉到了跳蚤。用学术语言讲,就是基于理论机制分析,重新设计出一个具有更高检验势(Power)的假设检验体系



#04

现实中的效率原则:理解法律审判规则

假设检验与法律审判其实是相通的(点此回顾“老姚趣谈如何理解假设检验的逻辑”),而法律审判中的“无罪推定”亦体现了效率原则。犯罪嫌疑人“无罪”就是法律审判中的原假设。如果犯罪嫌疑人最终被判无罪释放,那么这仅意味着目前没有证据证明其有罪,并不意味着现有证据可证明其无罪。其实,真要去证明无罪,根据前文所讲的道理,几乎是不可能的,或者至少成本非常高昂。
此外,为什么一般不要求犯罪嫌疑人自证清白?为什么一般应坚持“谁主张、谁举证”原则?两大问题的背后实际上都存在经济效率考量,亦即一般应由举证反驳成本更低的一方承担举证责任。为了更好地理解这一点,在此举一个简单的民事诉讼例子——

如果甲起诉乙欠了自己的钱不还,此时由甲承担举证责任,提供乙欠钱的证据,比如一张欠条,一般来说是最有效率的。

当然,也存在特殊情况。例如在行政诉讼中,行政机关作为被告,因为信息与证据收集能力一般强于原告(个人),那么由其收集证据来自证清白,一般来说是更有效率的。因此,在行政诉讼中存在“举证责任倒置”的法律规定。







企研学术顾问 · 耀军


姚耀军,1976年出生,湖北利川人,浙江工商大学金融学院教授、博士生导师,浙江省高校中青年学科带头人,浙江省首期之江青年社科学者,浙江省“151人才工程”第三层次培养人员,杭州市“十三五”哲学社会科学应用经济学学科组评审专家,企研数据学术顾问。长期从事金融发展理论与实证研究,在《China & World Economy》《Frontiers of Economics in China》《金融研究》《数量经济技术经济研究》《财贸经济》《中国农村经济》等学术期刊上发表论文多篇,部分成果被《新华文摘》《中国法经济学研究》《中国经济的转型升级:新结构经济学方法与应用》《高等学校文科学术文摘》《人大复印资料》收录或者转载。主持教育部人文社科项目、浙江社会科学基金重点项目、浙江省自然科学基金项目等纵向课题多项。荣获中国制度经济学年会优秀论文奖、全国金融硕士教学案例大赛优秀案例奖、浙江省高校优秀科研成果一等奖、《金融研究》优秀论文奖、《财经研究》创刊60周年优秀论文一等奖等荣誉。担任《金融研究》《财经研究》等多个学术期刊的审稿专家。



►一周热文

软件应用丨Python IDE之 pycharm的十大奇技淫巧

老姚专栏丨为何要对新冠肺炎特效药开展随机双盲对照实验

统计计量丨统计学中算变异量为什么要除以n-1?什么是「自由度」?

数据资源丨机器学习数据集汇总(附下载地址)

数据呈现丨比 Excel 更强大,Python 的可视化库 Altair 入门

老姚专栏丨线性回归:代数与直觉

数据资源丨原始数据哪里找?这些网站要用好!(建议收藏)










数据Seminar




这里是大数据、分析技术与学术研究的三叉路口




作者:姚耀军 杨奇明编辑:青酱






    欢迎扫描👇二维码添加关注    

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存