查看原文
其他

信用模型故事八则

董振磊 源点credit 2019-04-18



(一) 朱熹的“上面呢”

小朱熹刚刚学会说话,一天爸爸对他说,“抬头,看,上面是天”。

小朱熹的回应不像大多数开始学说话的小孩子那样,直接重复,“天”。

他来了一句,“天的上面呢?”。


(二) 纪晓岚的“下面呢”


一个可爱的老太监,追着纪晓岚,要他讲笑话。

纪晓岚停下来,开始讲,“从前,有一个老太监,”

然后,不说话了。

老太监着急地问:“下面呢?”

纪晓岚:“没有了。”

“哈哈哈哈”

多数时候,人类的思维是一阶的,就像太监一样,不思考下面的问题。朱熹那样具备高阶思维,一直追问“上面呢”的人极少。

思维的阶数,可以用这个数列来度量,你思考到第几个方程?

x,f(x),f(f(x)),f(f(f(x))),f(f(f(f(x)))),……

对信用建模时,停留在一阶,也不合适,需要一些模型的模型的模型......

(三) 柏拉图的洞穴


一个很深的洞穴中,一群囚徒被绑住了不能回头看,他们对着一面墙。

在他们的后面有各种各样的人在活动,墙上会倒映出那些活动的人的影子。

这群人一直相信这些影子就是真实的人、真实的活动。

人类也是一群这样的囚徒,面对这个复杂的世界,他们只看见了一些“影子”。

他们以为这些影子,就是真实的世界,就可以代表真实的世界。

他们给这些影子起名,叫做数据,信息(姑且统称为“知识”)等等。

对人类引以为豪的这些知识,一些具有高阶思维的人,称之为“叙事结构”(narrative),即一种对于复杂世界的简单YY。

我们所发现和建立的那些信用模型,不管是以学者名字命名的XX定理,还是以法律的形式规定下来的XX法,都只是一种YY。

(四) 巴甫洛夫的狗


顽皮的巴甫洛夫喜欢逗好朋友狗狗玩儿。

他反复地让狗狗挨饿,然后摇铃铛,给狗吃的。

然后,他在狗身上建立了所谓的“条件反射”。

在狗看来,这些“条件反射”,是真理,是规律,是知识。

一些信用领域的模型,是这么建立的。


(五) 斯金纳的鸽子


更加顽皮的斯金纳喜欢逗他的鸽子们玩儿。

他把鸽子们分成很多很多小组,在鸽子们进行各种各样的活动时,随机地给鸽子们喂食。

有趣的是,一组组的鸽子们,久而久之,都建立了自己的关于喂食的知识。

有的鸽子认为自己抬头就会落食物,有的鸽子认为自己煽动翅膀就会落食物,…

而斯金纳知道喂食其实是毫无规律的随机性。

看不见斯金纳的不确定性的鸽子们,建立了自己的确定性。

万物之灵的人类,也非常擅长发现和总结规律,尤其是伽利略和牛顿引领的科学革命之后,实验方法与逻辑思维的结合,使得“抬头-喂食”的反馈机制的建立,实现了很大程度的自主性。

很多信用领域的模型,是这么出来的。


(六) 斯金纳的蜜蜂


斯金纳的顽皮超出了你的想象,这一次,他逗起了蜜蜂。

蜜蜂飞出去寻找蜜源时,找到后飞回来,会跳一支舞蹈,来告诉大家蜜源的位置。

斯金纳坏坏地把蜜源放到了非常非常高的位置,一种大自然中没有的高度,然后让蜜蜂找到这个蜜源。

蜜蜂没有一种表达这种高度的基因程序,也缺乏一支表达这个高度的舞蹈。

蜜蜂飞回蜂巢后,跳起了一支莫名奇妙的舞蹈,其他蜜蜂一脸懵逼。

当现实的复杂超出了知识的局限,人类的表现也好不到哪里去。特别是现在他们有所谓的“大数据”和“机器学习”技术,发现规律能力指数级提升了,更是发明了“黑箱”这一自豪的词汇,来表达层出不穷的不知所云的“规律”。

面对复杂局面时,闭嘴比胡说难多了,尤其是当胡说的回报比闭嘴的回报大得多时。

你能察觉出来,信用领域中,那些手握着大数据、机器学习、深度学习、区块链等等高大上的技术的人,谁在跳一支不知所云的舞蹈么?

现在风口上的机器学习信用风险度量模型,很多是这么出来的。


(七) 塔勒布的小火鸡


春天时,塔勒布买回了一只小火鸡,小火鸡刚来塔勒布家时既害怕又谨慎。

塔勒布每天给它很多好吃的,小火鸡每天更新一下对塔勒布的信任水平。

随着时间的延长,训练集和测试集样本数量逐渐增大,模型的回测效果越来越好,小火鸡对自己总结出来的“塔勒布是一个好人”的结论的“置信水平”逐日上升,他越来越确信“塔勒布就是一个大善人”,99.9999%的概率。

小火鸡健康而快乐地成长着。

一天,塔勒布再一次给小火鸡喂了好吃的,放了古典音乐。

然后,扭断了它的脖子。

感恩节,到了。

塔勒布是一位“厨师”,他给这只小火鸡起名为“Sucker”,即轻易上当受骗的人。

你是火鸡还是厨师?

你的久经样本内外考验的大数据机器学习模型,有没有一个属于它的感恩节?


(八) 安东尼奥的船


   莎士比亚《威尼斯商人》中的富商安东尼奥开篇时自豪地说:“感谢我的命运,我的买卖成败并不完全寄托在一艘船上,更不是依赖着一处地方,我的全部财产也不会因为这一年的盈亏受到影响,所以我的货物并不会使我忧愁。”

然后,他自信地问犹太银行家夏洛克借了钱。

然后,他开往不同地方的三条船,全部沉没。

古罗马斯多葛派有一个信条:命运里,什么都可能发生。

数学上,称之为不确定性(Uncertainty)的“遍历性”(Ergodicity)。

一切事物的状态,不管现在还是未来,正如薛定谔的那只可怜的猫,都是处于多种状态的叠加之中,只不过,在我们当下的观察下,看到了其中一种状态而已。

一个人,一个组织的信用状态,也不是简单的守信红名单、失信黑名单之类的单一状态,如果戴上不确定性和遍历性的眼镜,每一个主体的信用水平,不管是现在还是未来,都是全部可能的信用状态的动态组合,红中有黑,黑中有红。

不能简单地根据观察到的历史信用记录(哪怕加上主观推算的未来可能性),来确定一个主体的不确定的当下和未来的信用水平,正如不能说薛定谔的猫是生是死。

信用水平,是不确定的。

没关系,我们有大数定律和中心极限定理,当样本量足够大时,信用水平的均值会回归到正态分布。在正态分布下,我们可以算出来平均的不确定性,控制住风险。

这种平均值对于正态分布的回归,很多时候,是一种恩赐。

对这种恩赐利用比较充分的,是保险业,通过分散化,对冲风险。

是否能够用大数定律分散风险的边界,叫做:Cramer condition.在Cramer condition之外,平均值不稳定甚至不存在,无法通过分散控制风险。

瑞典数学家Harald Cramér,保险精算先驱

大数定律的边界   


不幸的是,正态分布、大数定律和中心极限定理有主要适用于描述“自然界”,在与人的行为关系密切的“信息界”,如信用水平,财富水平,很少存在这样的简单便利的均值回归。

如果你假设了或者发现了这样的回归(或者你建模过程中某个不管多么狭小的角落出现了“正态分布”四个字),你可能是一只正快乐成长的小火鸡。

延伸阅读:

Nassim Nicholas Taleb(塔勒布),散文集:Incerto《不确定性》

塔勒布个人网站:http://www.fooledbyrandomness.com/

作者:董振磊,FRM(金融风险管理师),微信号 charliedong523,欢迎交流

相关阅读

诺贝尔经济学奖,一个假诺贝尔奖

损公肥私,一场信用游戏?




记录信用中国


近期推文

消息:央行企业征信机构备案或将重启

重点人群职业信用:税总发布涉税个人信用积分规则

央行首评 4327家金融机构获评官方“信用分”

区块链技术应用于征信业,火候到了吗?

【培训】社会信用体系建设问题与理论知识线下辅导班

《公务员法(修订草案)》公开征求意见 正被列为失信联合惩戒对象者不得录用

对AI+的骚扰电话,工信部出台了信用+综治方案

干货:红黑名单规范性文件汇总(截至2018年10月)


欢迎加入



公益 | 有益 | 有趣

欢迎加入我们的作者队伍

与7000名读者分享见解



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存