查看原文
其他

复杂系统入门必修课——幂律分布 | 全网独家

统计学侦探 集智俱乐部 2018-12-10

© Marlon Figgins



统计学出身的我,持有这样一个观点:真实的数据不会说谎。


然而,我们接触到的收入数据却似乎存在着一些问题。



用平均代表整体收入

是不是在耍流氓?



根据国家统计局的数据,2017年全国居民人均可支配收入是2.6万元,如果是正态分布的话,收入超过6万的人会很少。但实际上,早在2016年,就已经有20%居民的可支配收入超过了5.9万!(数据来源:国家统计局2017年统计年鉴)



最近几年,当统计数据显示北上广深的平均月薪近万或者过万时,都会引发大量北上广深年轻人“我又拖国家后腿”的吐槽。


而拥有可投资资产在1000万以上的“高净值人口”,在中国有10万人。


十万个千万富翁?富人比你想象的多很多!


富人为什么这么多?带着这个问题我请教了北师大系统科学学院的陈清华老师,终于了解到了真相。


原来,答案就在于幂律分布



实际上,人们的收入服从幂律分布,而不是正态分布。这意味着用平均去代表整体的水平,是有严重偏差的。


一方面,人们的收入是不均匀的,根据幂律分布中的二八准则,20%的人掌握着80%的财富


另一方面,这种不均匀极其严重。2016年,仅仅是最富有的8个人的财富,就超过了最贫穷的一半人口(36亿)的财富总和。(数据来源 新华社 http://www.xinhuanet.com/fortune/2017-01/17/c_1120324056.htm)


哈,富人不仅仅多,而且比你想象得更富!


在被现实一次次打脸后,我终于知道了原来幂律分布是这个样子,原来真实世界如此残酷!




幂律的力量

我们竟然一无所知



更让我惊奇的是,陈老师还让我了解到,这些复杂系统中的问题竟然都和幂律分布有关:


  • 为什么在收入、财富统计中,我们不能用均值代表总体?

  • 为什么古老的计算机病毒不能被根除

  • 为什么你的好友比你更受欢迎

  • 为什么大规模股灾隔三差五就会出现?

  • 为什么保险行业比我们想象的更加脆弱?

  • 为什么苹果公司亚马逊竟然可以达到一万亿美元?


二八准则、马太效应、黑天鹅、长尾理论、胖尾、无标度,它们之间究竟有什么区别和联系?


我一脸懵逼,学了四年的统计,幂律分布这么重要的普适规律,老师竟然没教过我?


真不明白为什么幂律分布仍然没有被列进统计学教科书 ?!




慢弃疗,

我们还可以再抢救一下!



为了让更多像我一样的同学不再万脸懵懂,我果断出手,以集智学园课程大侦探的特殊身份——

划重点 !!!


邀请到北京师范大学陈清华老师张江老联手为大家来系统讲解这门复杂系统的入门必修课——

《复杂系统中的幂律分布》

全网独家,为你打造体系完整的幂律分布学习框架


课程地址:

https://campus.swarma.org/gpac=394

扫码了解课程详情


课程主要内容


  • 了解理想国中的正态分布在大多数情况下是不对的:你是不是该换种思维方式了?

  • 现实世界中的种种幂律分布:为什么总有种“被平均”的感觉?!你能不能发现下一只黑天鹅?

  • 幂律分布的常见数字描述:从Zipf法则到Pareto分布;

  • 复杂网络中的重要研究:无标度网络的幂律分布特性,复杂网络研究从这里开始;

  • 熟悉幂律分布的产生机制,庖丁解牛,结构在心;

  • 了解幂律分布的相关估计与检验方法:处理数据的第一步,看分布

  • 了解幂律分布的现实应用,新理论下的幂律分布:幂律分布现在在宏观“生命体”当中的体现,新的关注方向;


希望幂律分布成为你在这个不平均世界里的眼睛和心法。


划重点 


上课方式


7节课 

10月10日起每周三晚19:00-20:30

线上直播


课程价格


系列课总价299元

限时折扣199!


另有学生价申请通道

请咨询“集智小助手”(swarmaAI)


首节免费 | 进群获取


扫码进群


    附:完整课程表


    第一课:白天鹅世界中的黑天鹅

    1. 白天鹅的世界

    2. 黑天鹅容易被发现吗?

    3. 幂函数的对数线性

    4. 奇妙的标度不变性

    5. 黑天鹅有着大影响


    第二课:从地震到神经元雪崩——普适的幂律法则

    1. 幂律分布在无生命的物理系统

    2. 有生命个体——人类、动物和植物的行为和表现

    3. 社会经济系统中的幂律分布

    4. 大脑工作也需要幂律

    5. 自组织临界


    第三课:从二八定律到长尾理论

    1. 不同语言的统一法则

    2. Zipf律的最省力原则解释

    3. 你相信80/20定律/Pareto法则吗?

    4. 长尾理论

    5. Zipf律,Pareto法则和幂律的关系


    第四课:稳健又脆弱的无标度网络

    1. 复杂网络研究的典型代表

    2. 无标度网络也具有普适性

    3. 无标度网络的集合特征

    4. 无标度网络的阿喀琉斯之踵

    5. 为什么难以根除计算机病毒

    

    第五课:无标度的世纪之争与幂律检验

    1. 对数线性回归

    2. 非线性回归

    3. 其他修改的回归

    4. 极大似然估计与检验

    5. 似然比检验


    第六课:复杂幂律背后的简单规则

    1. Gibrat模型及其扩展

    2. 货币转移模型

    3. 偏好依附模型

    4. 猴子随机打字模型

    5. 为什么幂律分布这么普遍


    第七课:规模法则与幂律分布

    1. 什么是规模法则?

        1.1 幂律分布与幂律关系

        1.2 Kleiber定律

        1.3 城市中的规模法则

        1.4 多样性的亚线性规模法则

        1.5 连接度的超线性规模法则

    2. 从幂律分布到规模法则

        2.1 Zipf定律与Heaps定律

        2.2 规模依赖的分布




课前预习


解读幂律与无标度网络 | 陈清华

贫穷限制了你的想象力?! | 讲座回顾

社交网络中的幂律分布

加入集智,一起复杂!



PC端传送门:

https://campus.swarma.org/





集智俱乐部QQ群|292641157

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存