查看原文
其他

商务统计学基础 | 引言:从不确定性出发

王汉生 狗熊会 2023-06-13
点击上方"狗熊会"关注我们吧!



从不确定性出发

人生是什么?人生就是一场充满不确定性的旅程!


人从小到大,充满了纠结,而纠结的源泉是什么?答:不确定性。假设有一天某个全能的先知告诉我:老王,明天就是世界末日了。请问:我纠结吗?答:我不纠结,一点都不纠结,就是很痛苦而已。请注意,纠结不是痛苦,痛苦不是纠结。如果我确信明天就是世界的末日,那么我会立刻好好安排今天剩下的时间。我应该和我最亲最爱的人在一起,把窖藏多年的二锅头喝个精光,把压箱底的82年的雪碧一饮而尽。总而言之,该干啥赶紧干啥,虽然对这个美好的世界有万般不舍,很是痛苦,但是不纠结。


什么时候我会纠结呢?如果全能的先知告诉我:老王,明天有50%的可能性是世界末日,而50%的可能性太阳会照常升起。请问;我该怎么办?如果我把把窖藏多年的二锅头喝个精光,把压箱底的82年的雪碧一饮而尽,但是明天太阳照常升起,岂不尴尬了?以后就没有二锅头喝了,压箱底的雪碧也没有了,岂不郁闷。但是,如果我不喝光窖藏的二锅头还有压箱底的雪碧,结果明天真的世界末日了,岂不可惜。哎呀,我到底应该怎样做才好呢?于是纠结的小草开始慢慢爬上了我的额头。


也许你会说,上面这个例子是你瞎编的,虽然有趣但是一点也不真实。那我跟你分享几个发生在我身上真实的故事。这些故事都太普通了,也发生在你身上,只是你没有注意到而已。


故事1

我老妈七十多岁了,这几年身体不大好。大概一年多以前,她得了一个奇怪的血液疾病,叫做“特发性血小板减少性紫癜”。你看,光这个名字就好长,我死活记不住。但是,这个病其实也挺普遍的。基本原理是这样的。老人家的免疫系统出问题了,然后横竖看自己身体生产的血小板不顺眼,然后就给消灭了。也就是说,老人家自己的免疫系统消灭了她自己造血系统生产的血小板。你说悲不悲催,误伤友军呀!一个正常人的血小板水平大概是150个单位,我老妈的血小板水平最低的时候只有2个单位。如果一个人的血小板只有2个单位,后果是什么?担心身上被划伤出血吗?答:不是很担心,因为这是外伤,你总有办法止血。而最让人担心的是:内伤。如果不小心造成了内脏出血,颅内出血,那后果不堪设想。


因此,我们赶紧去了重庆最好的血液科医院,尝试了各种治疗方案,效果都不理想。当所有的药物治疗方案都失败的时候,医生建议:也许可以考虑把脾脏切除掉。原因是:脾脏是血小板的坟场。人体被淘汰下来的血小板是在这里回收的。而也最有可能,老人家健康的血小板是在这里被破坏掉的。因此,如果切除脾脏,那么血小板就不会被破坏掉了。当然,切除脾脏的后果是,老人家的造血功能会降低,但是也能通过肝脏或者骨髓等其他器官得到一定的补充。如果手术成功,那么还不用吃激素类药物,所以从长期看也许是一个不错的治疗方案。当一家人正在为这个事情暗下决心的时候,医生又补充了一句:但是,这个治疗方案不能保证一定会成功。有20%的病人,切除脾脏后,病情并没有得到改善。


啊!这岂不是让人很纠结。如果切除脾脏就一定会好,那么我们也许可以努力下这个决心,毕竟这也不是一个很小的手术。但是,如果做出这一切的努力,结果没有效果,那岂不是让人很郁闷。你可以理解我的纠结吗?我为什么纠结?因为:这个手术治疗方案之于老妈病情有效性的不确定性。对,就是这个不确定性,让我非常纠结。[1]



[1] 很幸运的是,后来在医生的帮助下,老人家找到了对她有效的药物方案,而且治疗效果不错,所以后来就没有再考虑手术,也就没有纠结了。


故事2

我当年高考的时候,重庆仍然是四川的一部分,竞争非常惨烈。那时候的规则是,先填志愿,然后高考。也就是说在你还不知道自己高考成绩的情况下,你要报志愿。而现在的规则似乎是先高考,知道自己成绩后,然后再报志愿。显然,后者面临的不确定性就比较小,而前者很大。因此,我和我的同学们,必须对自己的高考成绩,在还没有考试的情况下,有一个预估。然后,根据预估的情况,决定如何报考志愿。对于我而言:我应该如何报志愿呢?虽然我所在的中学是县里最好的中学,但是北大清华也是绝对的稀缺品。每年,学校能出一两个就很不错了。而我的成绩似乎达不到年级前两名的水平。如果,我没有记错,我当年应该能做到年级前十名,但是做不到前两名。对于我而言,如果报考一个挑战性稍微弱一点点的学校(例如:人大、中科大、复旦等),把握性会非常大,而且这些都是非常好的学校。但是,如果我坚持要考北大,这个不确定性就很大很大。


我应该怎么办?太纠结了,太纠结了!后来,年轻的自己,无知无畏。一咬牙,一跺脚,心一横就报了北大。最后成绩出来,北大当年的录取线634分,而我638分。这个成绩怎样呢?答:不怎么样。那一年我的好多同学,最后成绩都比我高,我应该年级前十名都进不了,但是我报北大了。显然,我的同学们都非常优秀,一点也不比我差。但是,命运之神眷顾了我,给了我这个最好的学习机会。有时回想起来,心有余悸。如果当年的规则是:先知道高考成绩,再报志愿,我想北大就不会跟我再有半点缘分了。


亲爱的同学,这是我的故事,这是我生活中关于纠结的故事,这是我关于不确定性的故事。你能否想一下,你自己的生活中,碰到过哪些纠结的场景?多想几个,你会发现它们常常与不确定性高度相关。事实上,不确定性在我们的生活中,处处都在。要不然,我怎么说:人生就是一场关于不确定性的旅程。不信?我再给你几个案例看看。


案例1:恋爱

恋爱是人生中的一段特别美好的经历。有时让你幸福无比,有时让你伤心落泪。年轻人管这个叫做一场轰轰烈烈的恋爱,但是如果你站在一个非常理性旁观的角度,不禁要问:这么折腾为的是啥?如果一个姑娘觉得对面的男生很不错,而对面的男生也觉得这个姑娘很不错,那就结婚生子开心生活不就可以了吗?要恋爱作甚?


年轻的姑娘也许会说:这不行,万一我看走眼了怎么办?对面那个男生看起来是白马王子,其实是个渣男!我得通过恋爱这个过程考验考验他。年轻的小伙子也会说:这不行,万一我看走眼了怎么办?对面那个姑娘看起来非常温柔贤惠,其实是个绿茶!我得通过恋爱这个过程了解了解她。无论是考验,还是了解,反正通过这个恋爱过程,双方增进了了解。双方都可以有更多的机会观察对方,他(她)到底是一个什么样的人?他(她)是一个努力学习的人吗?(例如:统计学学的如何?)他(她)是一个勤奋的人吗?他(她)的老师如何评价她?他(她)的同事同学如何评价他(她)?成功的时候,他(她)是否得意忘形?失败的时候,他(她)是否坚持不懈?所有这些信息综合在一起,我才能更好地判断,对方是否是一个我值得付出真心的对象。


因此,我们需要异常轰轰烈烈的恋爱。对,你管这个叫做轰轰烈烈的恋爱,统计学家会认为这其实就是一个数据采集过程。通过采集大量的数据,每个人都会在自己的内心深处,做出一个回归分析模型,判断对方是否值得自己托付终身。而所有这些数据采集分析(或者轰轰烈烈恋爱)的过程,就是为了一个目的:减少未来婚姻中,幸福(或者不幸)的不确定性。对,这就是恋爱的统计学本质,降低不确定性!


案例2:求职

求职也有着巨大的不确定性。我的父母在西藏最艰苦的时候,援藏工作二十年。因为这个原因,我自己也有幸在西藏度过了四年难忘的时光。我的父母为祖国的边疆建设付出了时间、付出了青春、付出了和家人的团聚、甚至付出了健康。等到有一天,终于可以内调回内地了。按照国家政策,可以给他们好好地安排一个工作。请问什么样的工作单位是好单位呢?给定自己已经在西藏辛苦工作二十年,身体也不是很健康了,肯定希望找一个稳定轻松,福利好一些的工作。请注意,那是在八十年代末期,在一个小县城里。父母经过各种研究、打听、咨询,最后老爸选了一个非常理想的单位:物资局。


亲爱的同学,请问你听说过这个单位吗?这个单位曾经是非常好的单位。第一、事业编制的国有企业,这意味着不会有失业的风险;第二、权利不小,因为很多重要的物资(例如:钢筋、水泥、农药、化肥)都得从他们这里购买。所以,老爸精挑细选了这个单位,非常开心满意。但是,后面的故事大家都知道吧?国有企业的各种改革,各种市场化,很快物资局就变成了物资公司。当然,物资公司的市场化能力是很弱的,苦苦支撑了好多年后,就破产倒闭了。


请问发生在父辈身上的故事很特殊吗?答:不是的,类似的故事比比皆是。例如,我2003年回北大光华工作。当时的高校老师都是事业编制的终身制教员。当然,相当一个教授,可能非常难。但是,你不用担心失业。而北大光华从2003年开始,就执行严格的终身教授制度,而且只有正教授才是终身教职。这意味着,只有教学科研最拔尖的一批学者才能经得起这个严格的淘汰选拔。你看:高校教师也不再是铁饭碗了,更不要说企业岗位。哪里还有啥铁饭碗,统统要直面不确定性。


案例3:求学

北大光华有着非常优质的商学教育,这体现在我们各种各样的教学项目上。例如:本科、博士、MBA、EMBA、以及各种各样的专业硕士项目。以我负责的商业分析(Business Analytics)专业硕士项目为例,规模不大,但是每年趋之若鹜的优秀学子非常非常多。按照国家和学校的相关规定,我们有两个申请通道。一个是申请跨校保研。也就是说,如果一个本科生三年的同学,学业优秀,在自己所在学校就有保研名额,然后可以通过保研的通道申请进入光华的商业分析专业硕士项目学习。当然,每年有这样资格的同学很多,因此需要通过一个严格的夏令营面试和筛选,非常不容易。如果,一个同学此路不通,还可以通过全国研究生入学考试申请进入项目学习。但是,很多同学都非常优秀,本身是可以保送本校,或者其他学校的。如果要走招考这条路,那就意味着要放弃保送本校(或者其他学校)研究生的机会。但是,考研又何尝不是一个巨大的挑战呢?给定我们项目的名额实在不多,而对项目给予厚爱的同同学们都如此优秀,这个考研的过程也注定非常挑战,有很大的不确定性。如果你是其中一位同学,你要不要为这个不确定性而放弃(例如)保送本校研究生的机会呢?这个问题太难回答了。诚实地说,如果是我,我可能是没有这个勇气的。但是,每年我们的项目里都会碰到这样的同学,以极大的决心和勇气去挑战这个不确定性。

到此为止,我希望已经跟你达成了一个共识,那就是:人生处处都是不确定性。你也许会讨厌它,因为不确定性的存在,你今天美好平静的生活将注定起波澜。但是,我想告诉你的是,不确定性也有它好的一面。无论今天我们面对生活怎样的捶打,面对命运如何的挑战,这一切都会烟消云散。因此,不确定性的本质是中性的。但是,中性的不确定性,却如此重要。前面的故事和案例都告诉我们,不确定性能从不同的角度,影响着我们的生活,甚至决定了我们命运的轨迹。


如此重要的不确定性,我们是否应该发展一个完善的学科研究它呢?答案是显然的,当然需要呀!那么,请问哪个学科承担了这重要的使命呢?答:统计学。对,这就是我深爱的统计学。请注意啊,统计学不是研究统计的,这可是社会对它极大的误解。统计学全面、系统、规范地研究不确定性。有了统计学的帮助,你可以更好地理解,生活中的各种不确定性中,有多少成分其实是确定的,是可以把握的。有了统计学的帮助,你可以更加自信坦荡地面对生活的锤炼,因为你不再惧怕不确定性,相反你具备了与不确定性共舞的能力。不确定性不再是你前进路上的阻碍,而是你的得力助手,帮助你在竞争中获得相对优势。如此有魅力的学科,你难道不应该投入极大的热情好好学习吗?


所以,统计学研究的核心问题是什么?在我看来就是不确定性。当然,这里必须强调一点,这是我的一家之言,很多学者都会持有不同的看法,所以也欢迎大家批评指正。一种可能最常见的说法是统计学是研究数据的。这种说法乍一听似乎很有道理,但是仔细琢磨一下却似乎并不令人满意,甚至缺乏建设性。如果说统计学是研究数据的,那么能否说研究数据的就是统计学呢?这恐怕不可以,因为研究数据的学科太多了。计算机研究数据存储、传输、计算相关的软硬件以及各种算法模型。这是不是也算是研究数据的?我想显然是,而且事实上计算机学科在数据相关的科学发展方面进步巨大,令人钦佩。除此以外,经济学金融学管理学显然也研究数据。经济学研究经济数据,从中尝试理解经济的宏观微观规律;金融学研究金融数据,从中尝试解读金融资产的定价规律,以及人们在投资中的各种非理性行为;管理学研究企业管理数据,从中理解企业的战略、运营、营销、决策等方方面面。这些学科显然都与统计学有交集,但是能否说他们就是统计学?显然不能。所以,说统计学就是研究数据的,似乎缺乏必要的建设性。为什么?因为从这个看似正确的定义中,我们看不出统计学真正与众不同的独特之处。而一个更有建设性的定义应该能够快速将统计学最核心、最擅长的智慧给突出出来,并与其他学科做一个清晰的区分。而我认为这个最核心的区别就是:不确定性。所以,我认为统计学研究的核心就是不确定性。


那么,商务统计学研究的核心是什么呢?答:商业实践中的不确定性。如果说很多自然科学相关的学科中,有着非常多美妙绝伦的确定性规律,或是物理规律、或是化学规律、或是生物学规律。那么,在商业实践中,几乎不存在确定性规律。原因很简单,商业实践常常设计利益分配,常常涉及市场竞争。而只要有利益、有竞争力,就会产生持续对抗,重复博弈,而这就会产生不确定性。而谁能从这纷繁复杂的不确定性,洞察部分的确定性规律,就可以获得相对的竞争优势。为此,我们可以再看几个案例。


案例A:精准广告

请问广告能做到绝对意义上的精准吗?有朋友会说:如果广告推荐的内容是你想要,那就是精准的,不再构成骚扰。请问是这样的吗?我想喝可乐,你给我推荐可口可乐就是我想要的吗?百事可乐难道不香吗?考虑到夏天败火的需求,其实王老吉凉茶没准是一个更好的选择。虽然我想喝可乐,但是我不会买的,为什么?因为我肥胖,我糖尿病,我各种健康状况不允许我喝高糖饮料,我需要低糖的替代品。请问:在这种情况下,推荐给我什么产品才是精准?答:推荐啥都不可能精准,因为我自己都说不清楚我要买啥。在我进入超市之前,雄心壮志要买可口可乐,出来的时候发现我提的是二锅头。我自己都不知道我要买什么,凭什么你会知道?


你现在能理解了吗?只要是充分竞争的市场、有充足的替代产品,没有任何广告会达到绝对意义上的精准。这个跟数据无关、跟算法无关、甚至跟消费者本人都无关。这是市场竞争带来的自然产物。所以,消费者的选择具有巨大的不确定性,因此没有任何广告可以做到绝对意义上的精准。那么问题来了:为什么商家还如此热衷于打广告呢?原因很简单,虽然不会超级精准,但是给定骚扰人的成本足够低,能够骚扰的消费者足够多,打了广告还是比不打要好。但是,显然非常不精准,广告效果具有很大的不确定性。此时,如果有任何人能够对这个不确定性进行分析,他并不奢望能够彻底消除该不确定性(这显然不可能),但是如果能够通过数据、模型、算法,理解并化解其中一部分,那么可能就能转化为巨大的商业价值。在此类技术支撑下的“精准”广告,虽然做不到绝对精准,但是只要能够做到比传统广告更加精准,那就非常有意义。例如,传统的手机端实时竞价开平广告点击率才0.2%,我能做到0.4%,这就可能就代表着收入100%的增加。因此,实际工作者关心广告效果的不确定性,而统计学为研究该不确定性提供规范而系统的方法论。


案例B:信贷风控

信贷是一个历史悠久的业务,目测得有上千年历史。其业务形态非常简单。张三缺钱,找李四借钱,并约定好时间归还。届时,张三除了应该归还李四本金以外,还应该支付一个约定好的利息。在现实生活中,不排除这种可能性,李四是张三的好朋友,因此不介意张三是否偿还利息,甚至本金。但是,这是个别现象。个别现象支撑不了一个行业的存在。在绝大多数情况下,李四期待张三偿还的不仅仅是本金,还有一份额外的利息。为什么要收取额外的利息呢?答:这是张三使用李四资金所产生的成本,其中很大一块是因为李四为了对冲部分客户不偿还本金而带来的不确定性风险。


你看到了吗?李四为什么会在信贷业务中向张三收取一笔额外的,甚至是丰厚的利息费用?原因是:不确定性。如果,所有张三这样的客户,一定会到期准时偿还本金和利息,后果是什么?后果就是:李四这样的金主数目会激增,资金的供给量会猛增。反正借钱给张三是没有风险的,还有利息收益,为什么不向张三提供资金呢?因此,这会造成资金供给量的极大提升。然后会发生什么呢?接下来发生的就是资金使用成本的降低。对李四而言那就是利息收入的降低。为什么?因为这个社会上李四太多了,张三太少了。太多李四求着张三使用自己的资金,张三当然要挑选成本最低的资金使用。久而久之,这个行业的收益率会一路下跌,然后与银行的活期存款利率保持基本持平。这样的结果对于全社会而言是一个好事还是坏事,不好判断。但是可以确定的是,这样的结果对于信贷行业而言,不是好事情,因为这个行业就会因此消失。所以,信贷能够长期存在、长期繁荣的一个重要原因就是与还款风险相关的不确定性。而对于一个资金方(例如:银行)而言,各种信贷产品中特别重要的一个环节就是:风险控制。也就是说,要利用所有可利用的工具手段,以及数据分析方法,提前预判一个贷款申请人未来违约的风险,并将其控制在一个合理的范围之内。而统计学理论为信贷风控提供数据建模相关的核心方法论。


案例C:电话销售

我相信各位小伙伴跟我一样,也接到过各种各样的骚扰电话。像我这个年纪的爸爸妈妈们接到的典型骚扰电话就是孩子补习相关。现在的孩子学习压力是真心大。我记得自己上中学的时候,成绩在班上也是很不错的,但是没有太大的压力。一个原因是那时候不是每个同学都非常的鸡血努力。只要自己懂事早一点,努力多一点,成绩优势就会明显一点。但是,现在的孩子们还有家长们都非常努力。为了让孩子学习成绩更好一些,各种补习班也是应运而生,而且非常受欢迎。我们家的小伙子也没能例外,小学六年一直在上一个英语补习班,初中后改成了数学。客观地说,补习班对我们家小伙子成绩的提高是非常有帮助的,我们对补习班的老师是充满感激的。但是,有一个问题,那就是只要我参加了一个补习班,似乎很多其他补习班就知道了我的存在,然后疯狂给我打电话,不胜其烦!


当然,这是我作为一个消费者的感受。如果跳出消费者的角度,站在一个中立的位置去思考:为什么这个市场上会存在大量的骚扰电话?要知道骚扰电话也是有成本的。背后的运营方之所以如此坚持,原因很简单:真的有效果。对于很多行业而言电话销售真的带来销售业绩,而且甚至可能是最主要的销售业绩。如果,我们切换一下视角,从消费者的角度转换到电销人员的角度,请问他们的工作轻松吗?显然不轻松,非常辛苦。很多公司的电话销售团队是该公司每天第一个到公司的团队,多年如一日。一大早,到公司太早了,其他部门员工都还在路上呢,公司人少,正好完成一个工作:晨会。晨会的一个重要内容就是:小伙伴们大家一起高声唱一支慷慨激昂的歌,为自己接下来一天艰苦的工作鼓气。为什么?因为接下来一天太多电话要打,要无数次面对不客气的拒绝,内心要非常强大。一天辛苦下来,打了上百甚至更多的电话,能成几单?不同行业各不相同,但是一个大概的平均转化率在1%—2%左右,非常非常低。这说明:从电话销售线索(被打电话骚扰的潜在客户)到转化(实际购买的客户)的过程带有强烈的不确定性。


这种不确定性的一个直接反应就是:电销团队的工作苦不堪言,每天打无穷多骚扰电话,但是业绩平平。但是,所有的管理者都相信,这不确定性中,应该有一定的确定性,应该具备一定的规律可循。为什么?因为:每个月的销售冠军不是小王就是小李,他俩的业绩是别人的3—4倍,每月都是。这说明:小王小李之于电话销售而言,是应该有套路可循的。请问:能否把小王小李的销售套路,抽象出来,并以产品的形态固化下来。什么样的产品形态?答:销售线索打分。根据小王小李的宝贵经验,抽象出用于描述不同销售线索的数据指标,建立这些指标于最后线索转化之间的相关关系,并因此对不同的销售线索成单概率做出科学规范的评估。一旦有了这样的评估,管理者就能够知道销售线索池中哪些线索是转化概率高的优质线索?哪些是转化概率低的劣质线索?优质线索优先分配给最优经验的销售,极大化成单概率。而劣质线索也许就不值得执行,以节省运营成本。而统计学将为你提供一套规范的方法论去理解这背后的不确定性。

简单总结一下。亲爱的各位同学,人生就是一场充满了不确定性的旅程。有时,不确定性令人厌恶,给我们的生活添乱添堵。也有时,不确定性给我们带来意外的开心和幸福。不确定性之于个人、之于企业、之于行业、甚至之于国家,无处不在。如果你能掌握一套系统、规范、科学的方法论,帮助你去理解不确定性,洞察不确定性中的确定性,岂不是一件非常有趣的事情?那这样的一门学科是什么呢?答:统计学!




京东购书



当当购书

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存