查看原文
其他

商务统计学基础 | 第三章 假设检验:两种不同类型的错误

王汉生,王菲菲 狗熊会 2023-09-12
点击上方"狗熊会"关注我们吧!

前面提到,统计学假设检验理论关注的核心问题是:带有不确定性的决策问题。本章所关注的决策问题特指一类非常特殊的决策问题,那就是决策者面前有且仅有两个不同的选择。为讨论方便起见,不妨称这两个选择分别为:选择A和选择B,简称AB。不同的选择一定对应着不同的假设。例如,当一个女生获得了男生的追求时,该女生会面临两个选择,选择A可能是:尝试跟该男生交往;而选择B是:不尝试。如果该女生选择A,那么她背后隐含着一个假设:这个男生不错,也许值得尝试。同理,如果该女生选择B,那么她背后也隐含着一个对立的假设:这个男生可能不太靠谱,也许不值得尝试。由此可见,当人们面对二选其一的决策问题时,之所以做出不同的选择,其根本原因是人们做出了不同的假设。人们选择相信哪一个假设,就会做出相对应的选择,并形成相对应的决策。但是,因为有不确定性存在,无论如何选择、如何决策,都存在犯错误的可能性,并承担因此带来的后果。下面还是以恋爱为例,讨论决策者(某年轻人)可能会犯什么错误。第一种情况是,该年轻人假设对方不错(假设A),并决定跟他交往,但是却发现真实情况是:对方是一个非常糟糕的人(假设B)。这时他或者她犯的错误是:选择相信假设A成立,但是实际情况是假设B成立,这是一种错误。第二种情况是,该年轻人假设对方不太靠谱(假设B),并决定不和他交往,但是真实情况是:对方非常优秀(假设A)。这时他或者她犯的错误是:选择相信假设B成立,但是实际情况是假设A成立,这又是另外一种错误。请问:这两种不同类型的错误,带给决策者(该年轻人)的损失是否一样?如果损失完全一样,也许就不需要太高深的决策方法论(例如:统计学假设检验理论),只要极小化整体犯错误的概率就可以了,而不用担心哪种犯错的可能性更大。但是,如果损失不一样,其中一种错误的损失比另外一种大很多呢?如果是这种情况,决策问题就会相对复杂一些。在这种情况下,决策者应尽量避免犯损失更加惨重的错误。但是天下哪有免费的午餐?为此,决策者往往愿意也必须付出一定的代价,那就是,置另外一种错误发生的可能性于不管不顾的状态。请问聪明的你,对这样的决策方式陌生吗?答:一点都不陌生。接下来将通过一系列的案例故事向你阐述说明,对于这样的决策方式,你其实早已习以为常!案例1:恋爱。还是以前面提到的恋爱案例为例,故事中的年轻人面临二选其一的决策问题。在没有充分了解对方的情况下,对方的人品是未知的,具有不确定性。因此无论他或者她做出哪一种选择,都有可能犯错误。错误的情况有两种。第一种错误是:看走眼。假设对方很不错(假设A),但是发现实际情况是对方很糟糕(假设B),产生的后果是在一个很糟糕的人身上浪费时间。第二种错误是:错失真爱。假设对方不靠谱(假设B),但实际情况是对方很优秀(假设A),产生的后果是错失真爱,非常遗憾。请问:哪一种错误带来的损失更大?按小说和电影电视里的说法,也许错失真爱是天大的遗憾,为此男女主角爱得死去活来,骗得善良的你眼泪汪汪。如果是这样,年轻人的决策规则应该是:只要是恋爱,都应该勇于尝试,除非有证据证明对方很糟糕。但这可能是浪漫小说和影视作品里的虚构情节。在现实生活中,也许更多理性的普通人会认为,与错失所谓的“真爱”相比,在糟糕的对方身上浪费时间是一件更糟糕的事情。只要自己积极向上,优秀的“对方”多的是,错过一个“真爱”,也一定还有更好的“真爱”等着自己。因此,现实生活中更常见的决策规则会是:除非有证据证明对方很优质,否则不会轻易尝试交往。请问:你会更支持哪种看法?不论你支持哪一种看法,你都会体会到,两种不同的错误带来的损失很不相同,而且你会本能地优先规避你认为损失更大的那一种错误。你看,这是不是一种你已经习以为常的决策方法?案例2:求职。当求职者面临一份工作的机会时,就需要决定接受还是拒绝这份工作。假设一名毕业生拿到了某家互联网大厂的offer,他就面临着二选其一的决策问题:要不要进入这家互联网大厂工作?选择进入背后隐含的假设是这份工作是一份理想的工作(假设A),选择不进入背后隐含的假设是这份工作不是一份理想的工作(假设B)。在正式入职之前,工作内容、团队氛围、上升空间等等都是具有不确定性的,因此求职者有可能会犯错误。可能会犯的错误有两种。第一种错误是:得到不理想的工作。求职者相信这是一份理想的工作(假设A),于是选择进入这家互联网大厂,但工作后发现工作内容单调机械、团队氛围很差、上升空间小,并不是自己想要的工作(假设B)。第二种错误是:错过理想的工作。求职者认为这家互联网大厂的工作不是一份自己理想的工作(假设B),于是拒绝了这个工作机会。但后来他从接受了同样offer的小伙伴那里得知,这份工作能够让人发挥自己的创造力、团队氛围和谐、上升空间大,正是自己梦寐以求的工作(假设A)。两种错误的损失哪个更大呢?第一种错误让这位毕业生得到了一份并不理想的工作,而第二种错误让求职者错过了一个很好的工作机会。也许有人会认为第一种错误,即得到不理想工作的损失更大,因为不值得在一份没有成长的工作上浪费时间。相反,也许会有人认为第二种错误,即错过理想的工作带来的损失更大,因为好的工作机会非常难得,错过这个村就没这个店了,因此应该勇于尝试。不论你支持哪一种看法,你都会体会到,两种不同的错误带来的损失很不相同,而且你会本能地优先规避你认为损失更大的那一种错误。你看这是不是一种你已经习以为常的决策方法?案例3:求学。每年夏季,北京大学光华管理学院都会如火如荼地开展优秀大学生夏令营活动,通过保研招募优秀的大学生。遗憾的是,教学资源有限,因此招生名额有限,所以筛选与淘汰就不可避免。为此,夏令营中设置有笔面试考核。遗憾的是,不是所有同学都能够通过考核。如果能够通过考核,并且获得本校的推免资格,才有可能被预录取。如果你是一名有志于进入北大光华深造的大三学生,你面临的二选其一的决策问题是:申请夏令营还是不申请?如果你选择申请,那么背后隐含的假设是,你有可能通过夏令营考核并且获得本校的推免资格,从而成功上岸北大光华(假设A)。如果你选择不申请,那么背后隐含的假设是,你能成功保研到北大光华的可能性极低(假设B)。由于结果的不确定性,无论做哪种选择,你都可能会犯错误。可能犯的错误有两种。第一种错误是:高估自己。你假设自己能够成功通过夏令营的考核并最终获得入学资格(假设A),但是毕竟竞争残酷,最后你未能如愿以偿(假设B)。第二种错误是:低估自己。你假设自己成功的可能性极低(假设B),所以没有申请夏令营,但你最后发现综合实力还不如你的小伙伴成功上岸了(假设A)。这两种错误哪一种损失更大呢?第一种错误高估自己,能给你带来什么损失呢?答:几乎没有任何损失。虽然准备申请材料和笔面试花费了不少时间,但相信为申请而做出的各种准备会给你带来其他的益处。但是第二种错误低估自己带来的损失可能就严重许多。这种错误会让你错失一次到北大光华攻读研究生的机会,除非你有一个更好的求学机会。由此可见,两种错误带来的损失大小完全不同。高估自己所带来的损失很小,而低估自己所带来的损失很大。因此,对大多数同学而言,都应该尝试申请北大光华的夏令营。你看这是不是一种你已经习以为常的决策方法?案例4:精准广告。广告投放是各大互联网平台盈利的重要途径之一。以今日头条为例,它依靠大数据算法,根据用户的浏览历史等信息,分析用户的兴趣分类,向用户进行广告的精准投放。开屏广告是一种常见的广告展示形式。当用户打开今日头条APP时,今日头条就获得了一个展示广告的机会。这时候今日头条是否要向用户展示某款商品的广告呢?今日头条面临着二选其一的决策问题:投放还是不投放?选择投放背后隐含的假设是,用户对该商品感兴趣,因此有很大的可能性产生点击或购买(假设A)。选择不投放背后隐含的假设是,用户对该商品不感兴趣,因此产生点击或购买的可能性极低(假设B)。用户的兴趣具有不确定性,因此今日头条无论做哪种选择,都可能会犯错误。错误的情况有两种。第一种错误是:骚扰用户。如果今日头条假设用户对该商品感兴趣(假设A),并因此向用户展示了广告,但实际上用户对该商品不感兴趣(假设B),那么就对用户造成了骚扰。第二种错误是:错失广告机会。如果今日头条假设用户对该商品不感兴趣(假设B),因此放弃了向该用户展示广告的机会,但实际上用户正好需要这类型的商品(假设A),但由于没有看到广告,可能去购买了其他替代产品。两种错误的损失很不一样,哪一种损失更大呢?第一种错误对用户造成了骚扰,但对今日头条而言似乎没有立刻明显的损失。从长期来看,过度骚扰用户会影响用户的产品使用体验,进而影响用户活跃度与留存率,今日头条对此一定也会有慎重的考虑。但是从短期看,似乎不会产生太大的损失。但是第二种错误则让今日头条损失了一笔立刻可得的广告收入。请问哪种损失更大?根据彭博社消息,2020年,今日头条所属公司字节跳动的广告收入为1831亿元,占实际收入的77%。因此,损失广告收入对公司而言是不可承受的损失。所以今日头条的决策规则可能是,除非有足够的证据证明用户对商品不感兴趣,并因此决定不骚扰用户,否则一定选择展示广告。这个道理不仅适用于今日头条,还适用于其他互联网平台。造成的后果就是,广告在互联网平台中随处可见,用户被大量骚扰。你看这是不是一种你已经习以为常的决策方法?案例5:信贷风控。随着互联网金融的发展,互联网消费信贷已成为一种越来越常见的信贷形式,其特点是以个人消费为目的、无抵押、无担保、额度小、期限短等。仍然以上一节提到的蚂蚁花呗为例。假如一名用户提出了开通蚂蚁花呗的申请,那么蚂蚁花呗平台就面临着二选其一的决策问题:批准还是不批准?批准背后隐含的假设是,用户使用蚂蚁花呗后能够按期归还本息(假设A);不批准背后隐含的假设是,用户不能按期归还本息(假设B)。由于用户能否按期还贷具有不确定性,不管蚂蚁花呗平台是否批准,都有可能会犯错误。可能犯的错误有两种。第一种错误是:高估用户还贷能力。这种情况指的是,蚂蚁花呗平台相信用户借钱后能够按期归还本息(假设A),因此批准了开呗开通申请,但结果用户未能按期归还本息(假设B)。在这种情况下,蚂蚁花呗承受的损失是本金加利息。第二种错误是:低估用户还贷能力。这种情况下,蚂蚁花呗平台认为用户不能按期归还本息(假设B),不予批准开通申请,但事实上用户具有按期归还本息的能力(假设A)。在这种情况下,蚂蚁花呗将错失一个优质用户,并因此错失相关的利息收益。这两种错误的损失哪一个更大?第一种错误导致蚂蚁花呗损失了借出的本金(例如100元)加利息(例如10元),第二种错误导致蚂蚁花呗损失了潜在的利息收入。两种错误的损失很不一样,对比一下,显然第一种错误的损失更大。第二种错误承受的损失其实很小,甚至没有。因为在很多情况下,稀缺的可能是资金,而不是申请人。错失的申请人很容易被其他甚至更加优质的申请人替代。因此,蚂蚁花呗可能会谨慎审核申请人。你看这是不是一种你已经习以为常的决策方法?案例6:电话销售。相信大家都接到过推销电话,电话那头的推销员会询问你是否需要他们公司的产品或服务。电话销售之所以能成为一种经久不衰的销售形式,与我国极高的电话普及率有关。截至2021 5月,我国移动电话用户已达16.08亿。电话推销员是一份非常辛苦的工作,每天都要打数百个电话。面对销售线索池中的每一条手机号码,他们面临二选其一的决策问题:打电话还是不打电话?两个选择背后隐含着不同的假设。打电话背后隐含的假设是,号码的主人对产品感兴趣并因此能产生购买行为(假设A);不打电话背后隐含的假设是,号码的主人对产品不感兴趣,因此产生购买的可能性极低(假设B)。由于号码主人的兴趣具有不确定性,推销员可能会犯错误。错误的类型有两种。第一种错误是:打骚扰电话。如果推销员相信对方会对产品感兴趣(假设A),拨通了电话,但实际上对方并不感兴趣(假设B),那么对于对方来说这就是一通骚扰电话。第二种错误是:错失客户。如果推销员相信对方对产品不感兴趣(假设B),放弃了打电话,但实际上对方正好需要这类产品(假设A),但由于没有接到电话便去购买了其他产品,因此导致失去了一笔销售收入。第一种错误导致的损失是对号码的主人造成了骚扰,并浪费了一些电话费成本(例如0.1元),第二种错误则导致损失一笔交易单所带来的销售收入(有可能是10万)。对于电话销售公司而言,哪种损失更大?第一种错误的损失是骚扰某无关用户,并因此承受对方情绪上的输出。第二种错误损失的是可观的销售收入。在激烈竞争的市场中,显然第二种损失更不可承受。因此,对于绝大多数电话销售员而言,拼命地打电话是一个不二选择,这带来的副作用是大量的骚扰电话。你看这是不是一种你已经习以为常的决策方法?案例7:新药上市。新冠疫情爆发以来,许多新冠肺炎治疗药物研发都在进展当中。开发出安全有效的新药并投入使用当然是一件有益于人类的大好事,但如果还没有确认药物的安全性和有效性就贸然使用,就可能造成灾难。因此,新药在正式投入使用前,需要进行一系列试验,其中包括大量的动物试验以及至少三期临床试验。最终的试验结果,还需要得到药监局的认可与批准才能上市。假如有一款针对新冠肺炎的新药正在申请上市,药监局就面临着二选其一的决策问题:让新药上市还是不让新药上市?让新药上市背后隐含的假设是,新药能满足必要的安全性和最低的有效性要求(假设A)。而不让新药上市背后隐含的假设是,新药要么不够安全,要么不够有效(假设B)。药监局无论做哪种选择,都有可能犯错误。犯错误的情况有两种。第一种错误是:让劣药上市。药监局相信新药满足安全性和有效性等基本要求(假设A),并因此批准了新药上市,但最终发现该药物很不安全,而且无效(假设B)。第二种错误是:错过良药。药监局认为新药不满足安全性和有效性等基本要求(假设B),未批准新药上市,但其实新药的安全性和有效性都是有保障的(假设A)。这两种错误哪种损失更大?第一种错误带来的后果是劣药上市,大量无辜病人因此付出健康甚至生命的代价。第二种错误带来的后果是延缓了一款优质药品的及时上市,因此很多病人得不到及时救治,并因此付出健康甚至生命的代价。请问哪一种错误带来的代价更大?其实都很大。但是在咱们的一般社会伦理规范中,哪一种相对更能接受?答:第二种。因为与现状相比,第二种错误带来的后果没有比现状更好也没有比现状更差。但是第一种错误带来的后果比现状更差。因此,药监局的决策规则永远是首先假设该新药不安全且无效,因为这样的假设更保守。你看这是不是一种你已经习以为常的决策方法?案例8:法官判案。有一天老王跑到法庭状告老李,说老李骗走了他的钱财,请求法官为他作主,将老李绳之以法。请问法官应该如何决策?假设你是法官,那么你面临着二选其一的决策问题:判老李有罪还是无罪?判老李有罪背后隐含的假设是,老李实施了诈骗行为(假设A);判老李无罪背后隐含的假设是,老李没有实施诈骗行为(假设B)。毕竟法官也不在案发当场,无法掌握充足信息,因此一定有犯错误的可能性。可能会犯的错误有两种。第一种错误是:冤枉好人。法官认为老李实施了诈骗行为(假设A),于是判老李有罪,但事实上老李是清白无辜的(假设B),这就导致了一起冤案。第二种错误是:错放坏蛋。法官认为老李没有实施诈骗行为(假设B),于是判老李无罪,但事实上老李就是诈骗犯(假设A)。这两种错误的损失哪个更大?其实都很大。但是哪一种错误更能被社会所原谅?显然是第二种。第一种错误导致冤枉一个好人,将一个好人关押服刑,这产生的社会影响太恶劣。相对而言,在证据不足的情况下,错放一个坏蛋,更能被全社会原谅,毕竟原告老王有举证的义务。因此,在实际工作中,法官的默认决策永远是老李无罪。这就是我国现代刑事司法实践中的“疑罪从无”原则。你看这是不是一种你已经习以为常的决策方法?案例9:主编审稿。对于科研工作者来说,向期刊投稿是一件不陌生的事。一篇论文从投稿到发表需要经历漫长的时间。一般来说,论文首先分派给主编,然后主编会把论文分配给一位副主编,然后由副主编邀请审稿人审稿,审稿人完成审稿后再将审稿意见返回至副主编,副主编会形成评审建议再反馈给主编。最后主编会根据审稿意见和自己的判断,决定接收还是拒收论文。这时主编面临的就是二选其一的决策问题:接收还是拒收?接收论文背后隐含的假设是该论文比较优秀,达到了期刊的标准,并能形成不错的学术贡献(假设A)。拒收论文背后隐含的假设是,该论文完全达不到期刊所期待的标准(假设B)。毕竟术业有专攻,主编也不可能通晓所有的专业方向,因此论文发表后在学术界会受到怎样的评价具有不确定性,主编完全有可能会犯错误。可能犯的错误有两种。第一种错误是:错误接收。主编相信论文比较优秀,达到了期刊的标准(假设A),于是接收了论文,但论文发表后反应平平,甚至遭到许多学者的质疑(假设B)。第二种错误是:错误拒绝。主编认为论文水平很差(假设B),但该论文在其他期刊发表后饱受赞誉(假设A)。这两种错误哪一种损失更大?第一种错误直接影响了期刊的声誉,第二种错误让期刊错失了一篇优质论文。对于期刊而言,显然是第一种错误的损失更大,因为期刊的声誉一旦下降就很难挽回。相反,只要期刊的学术声誉在,不愁没有优质的论文投稿。因此,期刊主编的决策规则应该是:除非有充分的证据证明论文很优秀,否则拒收论文。你看这是不是一种你已经习以为常的决策方法?案例10:签证审批。赴美留学生需要向美国领事馆申请F1签证。因为F1签证是一种仅用于留学的非移民签证,不能用于移民,所以如果F1签证的申请人表现出有移民倾向,很可能会被签证官拒签。签证官面临一个二选其一的问题,他们必须做出判断:申请人是有移民倾向还是没有移民倾向?如果相信申请人有移民倾向(假设A),签证官会选择拒签;如果认为申请人没有移民倾向(假设B),签证官就更可能批准F1签证。由于签证官只能从申请人提交信息和与申请人的谈话等方面来判断申请人是否有移民倾向,但申请人的内心真实意图是具有不确定性的,所以签证官有可能会犯错误。可能犯的错误有两种。第一种错误是签证官相信申请人有移民倾向(假设A)于是拒签,但申请人其实没有移民倾向(假设B),因为没有拿到签证,未能按期入学,承受很大损失。第二种错误是签证官相信申请人没有移民倾向(假设B),而且申请人也满足办理签证的其他条件,于是签证官批准了签证,但事实上申请人是假留学真移民(假设A)。哪一种错误造成的损失更大?对于签证官而言,也许是第二种错误的损失更大。第一种错误导致的损失都是由留学生承受,对签证官似乎没有什么影响。而第二种错误有可能导致非法移民,这是签证官巨大的工作过失。因此,签证官的决策规则会是:默认申请人有移民倾向,除非有充分的证据能证明申请人没有移民倾向。你看这是不是一种你已经习以为常的决策方法?到此为止,相信你已经了解了一个道理,那就是,面对带有不确定性的二选其一的决策问题,我们常常会面临两种可能的错误。这两种错误带来的损失很可能差别巨大。其中一种很难承受,而另一种似乎还可以忍受。在这种情况下,我们应该如何决策呢?通过上面的案例讨论,你会看到一个特别简单的决策规则,那就是:尽量避免带来更惨重损失的那种错误,而置另外一种错误发生的可能性于不管不顾的状态。这样的决策规则貌似非常奇葩,但是通过上面的案例讨论,你会发现,这其实就是我们最常见的决策方式。统计学的假设检验理论,正是将该决策规则规范为一个可以通过严格的数学方法研究的科学问题。这是统计学做出的重要贡献。将决策规则进行规范化的过程要从对两类可能的错误进行严格区分开始。按照统计学假设检验理论的严格定义,哪种错误损失更惨重、更难以接受、更应该规避,哪种错误就被称为:第一类错误(Type I Error)。而另一类可接受性要好很多的错误就是:第二类错误(Type II Error)。为了优先规避第一种错误,决策者一定要优先默认某个假设成立,除非有充分证据证明该假设不成立。这个被优先默认的假设叫做原假设(Null Hypothesis),记作H0。当有充分证据证明原假设不成立时,决策者才会选择相信另一个与原假设相对立的假设,它叫做对立假设或者备择假设(Alternative Hypothesis),记作H1。接下来,结合前面的案例,我们对什么是原假设,什么是备择假设,再做进一步讨论。案例1:恋爱。女生在遇到男生的追求时,遇到的二选其一的决策问题是:尝试与该男生交往还是不尝试?前面提到,可能犯的两类错误是看走眼和错失真爱。对于哪一种错误的损失更大,看法可能因人而异。如果这个女生认为看走眼的损失比错失真爱的损失更大,那么第一类错误(Type I Error)就是看走眼,第二类错误(Type II Error)就是错失真爱。为了尽可能地规避第一类错误,女生会默认男生不值得交往,除非有充分的证据证明男生很优质。所以原假设H0就是:男生不靠谱;而备择假设H1是:男生很优质。案例2:求职。对于一位收到了某互联网大厂offer的毕业生,是否要进入该互联网大厂工作是一个二选其一的决策问题。在这个决策问题中可能犯的两类错误是得到不理想的工作和错过理想的工作。对于哪一种错误带来的损失更大,看法可能因人而异。如果这位毕业生认为得到不理想工作的损失比错过理想工作的损失更大,那么第一类错误(Type I Error)应该是得到不理想的工作,而第二类错误(Type II Error)应该是错过理想的工作。为了首先规避第一类错误,毕业生会默认这是一份不理想的工作,除非有充分证据证明工作很理想。因此原假设H0应该是:这是一份不理想的工作;而备择假设H1是:这是一份理想的工作。案例3:求学。对于一位大三本科生,是否要申请北大光华的夏令营是一个二选其一的决策问题。在这个决策问题中可能犯的两类错误是高估自己和低估自己。低估自己的损失(错失被北大光华录取的一次机会)比高估自己的损失(几乎没有损失)要大得多,因此第一类错误(Type I Error)应该是低估自己,而第二类错误(Type II Error)应该是高估自己。为了首先规避第一类错误,学生会默认自己能够成功获得北大光华的入学资格,除非有充分证据证明自己不能成功。因此原假设H0应该是:自己能够成功获得北大光华的入学资格;反之备择假设H1是:自己不能成功获得北大光华的入学资格。案例4:精准广告。对于互联网广告平台来说,是否要向用户展示广告是一个二选其一的决策问题。广告平台可能犯的两类错误分别是骚扰用户和错失广告机会。错失广告机会的损失(广告收入)比骚扰用户的损失(短期内没有明显的损失)大得多。因此第一类错误(Type I Error)应该是错失广告机会,而第二类错误(Type II Error)是骚扰用户。为了优先规避第一类错误,广告平台会默认用户对产品感兴趣,并选择投放广告,除非有充分的证据证明用户对产品不感兴趣。因此原假设H0应该是:用户对产品感兴趣;而备择假设H1是:用户对产品不感兴趣。案例5:信贷风控。用户在申请开通蚂蚁花呗后,蚂蚁花呗平台是否批准该申请是一个二选其一的决策问题。蚂蚁花呗平台可能犯的两类错误是高估用户还贷能力和低估用户还贷能力。高估用户还贷能力的损失(本金加利息)比低估用户还贷能力的损失(潜在利息)大得多。因此第一类错误(Type I Error)应该是高估用户还贷能力,而第二类错误(Type II Error)是低估用户还贷能力。为了优先规避第一类错误,平台会默认用户还贷能力不足,并选择不批准开通申请,除非有充分的证据证明用户在借钱消费后能按期归还。因此原假设H0应该是:用户借钱后不能按期归还;而备择假设H1是:用户借钱后能按期归还。案例6:电话销售。对于电话推销员来说,是否向某个手机号打电话是一个二选其一的决策问题。电话推销员可能犯的两类错误是打骚扰电话和错失客户。错失客户的损失(销售收入)比打骚扰电话的损失(例如电话费)大得多。因此第一类错误(Type I Error)应该是错失客户,第二类损失(Type II Error)是打骚扰电话。为了优先规避第一类错误,推销员会默认对方需要自己推销的产品,并选择打电话,除非有充分的证据证明对方对产品不感兴趣。因此原假设H0应该是:对方对产品感兴趣;而备择假设H1是:对方对产品不感兴趣。案例7:新药上市。药监局是否批准某种新药上市是一个二选其一的决策问题。药监局可能犯的两类错误是让劣药上市和错过良药。让劣药上市的损失(危害病人生命安全)比错过良药(市场上少了一种良药)的损失更难以接受。因此第一类错误(Type I Error)应该是让劣药上市,而第二类错误(Type II Error)是错过良药。为了优先规避第一类错误,药监局会默认新药不符合上市标准,除非有充分的证据证明新药符合上市标准。因此原假设H0应该是:新药不符合上市标准;而备择假设H1是:新药符合上市标准。案例8:法官判案。对于法官来说,是否判嫌疑人有罪是一个二选其一的决策问题。法官可能犯的两类错误是冤枉好人和错放坏蛋。从人权角度来看,冤枉好人所产生的负面社会影响比错放坏蛋所产生的负面社会影响要大很多。因此第一类错误(Type I Error)应该是冤枉好人,第二类错误(Type II Error)是错放坏蛋。为了优先规避第一类错误,法官会默认嫌疑人无罪,除非有充分的证据证明嫌疑人有罪。因此原假设H0应该是:嫌疑人无罪;而备择假设H1是:嫌疑人有罪。案例9:主编审稿。对于学术期刊的主编来说,是否接收某篇论文是一个二选其一的决策问题。主编可能犯的两类错误是错误接收和错误拒绝。错误接收的损失(降低期刊学术声誉)比错误拒绝的损失(错失优质文章)大得多。因此第一类错误(Type I Error)应该是错误接收,而第二类错误(Type II Error)是错误拒绝。为了优先规避第一类错误,主编会默认论文水平很差,除非有充分的证据证明论文很完美。因此原假设H0应该是:论文有需要改进的地方;而备择假设H1是:论文很完美。案例10:签证审批。对于签证官来说,判断申请人是否有移民倾向是一个二选其一的决策问题。签证官可能犯的两类错误是误以为申请人有移民倾向和误以为申请人没有移民倾向。对签证官来说,误以为申请人没有移民倾向的损失(非法移民)比误以为申请人有移民倾向的损失(为难留学生)大得多。因此第一类错误(Type I Error)应该是误以为申请人没有移民倾向,而第二类错误(Type II Error)是误以为申请人有移民倾向。为了优先规避第一类错误,签证官会默认申请人有移民倾向,除非有充分的证据证明申请人没有移民倾向。因此原假设H0应该是:申请人有移民倾向;而备择假设H1是:申请人没有移民倾向。通过本节的案例讨论,你应该已经对两种不同类型的错误有了充分的了解。第一类错误(Type I Error)是损失更大、更不可接受、应优先规避的错误,而第二类错误(Type II Error)是相对来说更能够接受的错误。为了优先规避第一类错误,决策者必须优先默认原假设H0成立。虽然原假设H0是默认的假设,但是绝不意味着我们永远不会接受备择假设。以新药上市为例,虽然药监局会优先假设新药不安全且无效,但是如果有足够证据证明新药安全且有效,那不是一个更好的结果吗?因此,人们虽然优先假设原假设H0成立,但总是心心念念地希望能够采集到充分的证据证明H0是错的,进而可以接受备择假设H1。而如何才能接受备择假设呢?这就是下节要学习的内容。


京东购书



当当购书


往期推荐

引言:从不确定性出发

第1章:不确定性的数学表达:连续型数据

第1章:不确定性的数学表达:正态概率密度

第1章:不确定性的数学表达:t-分布

第1章:不确定性的数学表达:指数分布

第1章:不确定性的数学表达:0-1分布

第1章:不确定性的数学表达:泊松分布

第2章:参数估计:矩估计

第2章:参数估计:极大似然估计

第2章:参数估计:正态分布均值的区间估计

第2章:参数估计:正态分布方差的区间估计

第2章:参数估计:其他分布参数的区间估计

第2章:参数估计:样本量计算

第3章:假设检验:不确定性与决策


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存