查看原文
其他

【原创】粘性纽扣与社区生长

jake 集智旧号 2018-12-11

粘性纽扣


假设有这样一种神奇的粘性纽扣:它只要和其它的粘性纽扣有所接触就会永久地蘸粘在一起,并产生一根连线绑在它们俩的中心。

让我们拿粘性纽扣做这样一个实验:我们先在地面上某点固定一个粘性纽扣;然后不停地将新的粘性纽扣一个一个随机地往地上扔,如果新纽扣偶尔粘上了一个已存在的纽扣,则它就会呆在那里不动;如果没有黏着,则它会落到地面消失[1]。

我们不妨用下面的图来表示这个实验:


在图中,每一个灰色的圆就是一个粘性纽扣,我们把它们出现的顺序标在了它们的中心上。这样,1就是那个初始的固定的纽扣,2、3都可以成功地黏着到现有的纽扣上,而4则会掉到地上消失。

就这样一个纽扣一个纽扣地加入,最后的纽扣网络是什么样子的呢?

这是一次试验在经历过上千次纽扣投掷,最后蘸粘了100个纽扣的网络样子。



这是另一次试验在第10、100、500和1000次投掷纽扣之后网络的样子。


网络社区


这个粘性纽扣网络简单吧?但是,你别小看它,因为它可以比喻互联网社区的生长过程。为什么?

1、首先,每个纽扣可以看作一个人,或者是社区里面的一个注册用户;

2、其次,每个纽扣所在的位置可以看作是每个用户的个性偏好,相当于这个用户的小生境;

3、再次,每个纽扣周围黏着的纽扣就是这个用户的好友,它们往往兴趣相投(坐标邻近),连线表示的是好友关系,而纽扣的半径表示的就是一个人的兴趣覆盖范围;

4、最后,纽扣网络的生长过程与互联网社区的生长过程很相似:以一个或几个活跃用户为种子,逐渐吸引兴趣相投的用户,然后整个网络会越滚越大。

有意思的是,这不仅仅是一个粗糙的比喻。事实上,这个粘性纽扣模型可以很好地复现出真实网络社区生长过程中的一些重要特性。比如:


1、加速生长特性


在很多真实的互联网社区中,我们都会看到一种加速生长的现象:也就是说,在社区刚刚建立的时候,整个社区的生长非常缓慢,偶尔会有一些零星的人加入,而且相互之间的讨论、交互也不是特别积极。然而,随着这个社区一点点地壮大,人越来越多起来,社区的成长就会越来越快。如果我们将社区的规模与成长时间画成一条曲线,则这条曲线看起来会很像指数曲线。

让我们再来看模型。由于我们的纽扣是完全随机地往地面上扔的。在开始的时候,只有一个种子纽扣存在那里,所以大部分随机投掷的纽扣就会因为落到地面上而消失了,网络几乎不成长。但是,当一些纽扣偶然粘连到种子上,并进而粘连更多的纽扣,纽扣们所覆盖的面积就会越来越大。随着纽扣网络的面积增大,新扔进去的纽扣就会有更大的概率碰到这个网络上,而一旦碰上它就会被粘连。于是,这个网络生长的速度也就会越来越快。

实际上,如果我们把人比喻成纽扣,就会发现,一个人之所以会进入一个社区就是因为它能在这个社区找到兴趣相投的人,这与一个随机投放的纽扣可以找到临近的纽扣是一个道理的。


2、密集化


一个成熟的互联网社区往往具有非常大的粘性。这是因为,一旦社区的注册用户达到了一定规模之后,这群人彼此之间的互动也会越来越复杂,这就导致了社区的粘性也会越来越大。也就是说,随着社区的生长,成员彼此之间的互动要比社区规模更快速地生长,每个成员平均拥有的连接数是在越来越密集化的。

如果我们将纽扣系统中的连线数量看作是社区中的互动数,我们就会发现,纽扣网络也有着密集化的趋势。为什么会这样呢?由于每一个新的纽扣投入到网络中,它可以落到整个网络的外围边缘,也有可能落入到与中心种子纽扣靠近的地方,而这两种情况发生的概率是相同的。于是,在种子纽扣的核心区域聚集更多节点的可能性也就会越来越大。那么,整个网络就会逐渐形成中间密、外围稀疏的情况。这样,每加入一个新的纽扣,它所带来的链接数就会越来越多,于是密集化现象就会形成。


3、多样化


随着网络社区变大,成员口味的多样性也会越来越多:所谓萝卜白菜各有所爱。但是,由于一个社区往往是以同好为基础的,所以即使多样性越来越大,但是总的来看,多样化的趋势会比社区的规模增长得要慢。这体现为:每加入一个新成员它与其它已有成员都不同的可能性会越来越小。

同样,在纽扣网络模型中,由于纽扣所在的位置就相当于一种兴趣爱好,或者一类人。那么,纽扣网络所覆盖的面积就相当于整个社区的多样性。有趣的是,随着纽扣网络的增加,网络覆盖面积虽然也在增加,但是面积的增速要远小于网络规模的增速。这是因为:随着纽扣网络的面积变大,一个新纽扣就会以更大的概率落到这个网络的中心区域而非边缘。于是,这个新纽扣所带来的面积增长的贡献就会逐渐递减。

如果你觉得这种比较仅仅是定性上的不能算科学,那么,下面我们就来展示一下定量化的比较结果。



这两张图分别展示的是Delicious社区(一个英文的网络社区)和纽扣模型生成的各种变量随社区规模变化的情况。在图中,蓝色的线表示的是Delicious社区中的活动(加标签)的数量(相当于是相互作用的数量)或者是纽扣上的连线数量;黄色的线是标签种类数(相当于多样性)或者是纽扣们覆盖的总面积;紫色的线则是社区或网络增长的时间。我们发现无论是真实社区还是纽扣网络模型,这些变量都与规模构成了幂律关系。通过进一步计算幂指数大小,我们还可以看出相同颜色的线在左右两张图中的指数数值(标在了曲线上方)很接近。

无独有偶,很多社区也会展现类似的规律。第一张图是Flickr,这是一个图片分享、加标签的社区。我们把系统中的总加标签活动数量作为相互作用数,而标签的种类就是多样性程度。第二张图则展示了美国物理协会发表的科学论文所构成的社区。其中,活动数就是这些文章彼此之间的引用情况,多样性就是这些文章所用过的所有PACS分类编码(美国物理协会的一套学科编码体系)的总数量。我们发现它们的生长也与模型所预测的性质完全相同。

由此可见,真实网络社区的生长的确可能遵循着类似粘性纽扣网络的生长过程。它们从少数几个核心成员开始,逐渐吸引一些外围具有同样兴趣爱好的人加入进来。慢慢地,这个网络还在不停地扩大生长,而且这种趋势会越来越大,多样性也会越来越丰富。

纽扣网络模型还能揭示出真实网络很难观测到的现象:多样性增长和互动增长具有一种有趣的互补性。具体来说,通过模型的分析与计算,我们发现,刻画多样性生长的指数与刻画相互作用生长的指数加起来衡等于2。这意味着,如果多样性生长得越快,成员之间的相互作用生长得就必然会越慢。所以,一个社区过于快速的生长会导致成员之间互动下降。反过来,如果希望社区能够稳定地保持一定的粘性,那么我们就应该放慢社区用户的多样性生长步伐。但是,如果完全没有了多样性,相当于所有纽扣都落在种子纽扣上面,那么整个网络都很难长起来。

城市

下面,让我们暂时忘掉互联网社区,而是将眼光和视角进一步提升到更大的尺度:城市。实际上,城市也可以看作一个超大规模的人类社区,在其中,成千上万的人形成超大规模的互动。下图是从高空俯瞰巴黎城市夜光。

看着这一条条貌似血管网络一样的城市街道,我们仿佛可以感受到整个巴黎城市的心跳。上百年来,人类一直试图利用定量的语言来刻画城市生长,并试图找到其背后的基本原理。

人们的确找到了一些刻画城市的普适规律,例如:在一个国家中,如果将大大小小的城市按照它们的人口从高到低排成一条曲线,那么这条曲线必然遵循幂律的法则,这就叫城市的Zipf定律。另外,人们还发现,城市的很多重要宏观变量,例如GDP、总收入、发明专利数、二氧化碳排放量、城市道路总长度、总的电力消耗等等,都可以用城市的总人口来很好地给予预测,而且也是幂律关系。系统地研究这些幂律的指数大小,可以总结成如下表[2]:

在这张表中,所有的城市宏观变量按照与总人口的幂律指数可以分成三种:指数大于1的变量,包括GDP,新专利数、总工资等等。这意味着,随着城市人口的增大,人均GDP、专利数、总工资都会增长。事实上,这恰恰是城市创新功能的最好体现。另外,还有一些变量,包括面积、加油站数量、道路长度等等的指数小于1。这意味着,随着城市规模生长,人们会感觉到越来越拥挤(人均面积减少)、人均加油站数量、道路长度会越来越少。还有一些与住户和人口相关的变量指数等于1。

这些实证发现背后有没有一种简单的解释呢?

答案是肯定的,这个解释居然还是我们的黏性纽扣模型。等等,这是不是也有点太夸张了吧?一个模型既能比拟网络社区又能比拟城市?没错,一个足够好的抽象模型完全可以将表面上看起来不同的事物很好地联系起来。只要我们在原模型上稍加改进,并引入一个参数,它就可以很好地模拟不同城市的生长,以及各种变量,包括人口、道路、人类社会经济活动在空间上的分布情况,我们甚至可以利用模型进行一定的微观预测。

黏性纽扣完全可以比拟为城市中的人类社区。而整个地面的二维空间就好像是城市所在的地理空间。纽扣一个接一个地加入就好像人口的迁入或者是新小区的建成。只有粘连上的纽扣可以存活这条规则比拟了人类需要相互连接才能生存的道理。

这样,纽扣一个一个地粘连上去就仿佛是一个城市一点点地生长起来。当然,城市还要有道路,我们可以简单地用围绕着纽扣们生长的Voronoi多边形来刻画(参见方框中的内容)。有了道路网络,人与人就可以通过道路这个界面完成彼此的互动,从而形成各式各样的人类社会经济活动。


Voronoi多边形构成的路网


我们在原模型中引入新的假设以建模道路。假设道路都是围绕着人类社区建立的,也就是说我们以每一个纽扣中心的节点为中心,以任意两个节点的中垂线作为一条分割这两个小区的道路。这样,多个中垂线就会相互交错而形成一个庞大的路网。在数学中,这样的网络叫做Voronoi多边形,如图所示


图中的黑点就是一个个纽扣的中心,多边形的边就构成了道路。


按照改进的模型,以及这些新的假设下,我们的模型就能够生长出一个模拟的城市出来!


看,左图是模型生成的人口社区和道路网络,右图是伦敦城的社区分布情况。二者从定性的角度看非常相似。进一步,我们还可以定量地比较城市中的人口分布与模型中纽扣密度的分布情况[4]。



如图所示,散点是伦敦和北京的人口密度随着到市中心距离衰减的情况。曲线则是通过调整模型中的唯一参数而得到的拟合曲线。我们看到,两者非常一致地拟合在了一起。不仅如此,我们还将城市道路长度以及人类社会经济活动(用城市夜光亮度来刻画)在空间上的分布情况与模型进行了对比,二者完美的附和在了一起。

进一步,由于模型可以将城市中的不同元素,例如人口、道路和经济活动联系到一起,因此,我们甚至可以用其中一个元素的空间分布来预测另一个元素的分布。比如,下图就是根据我们的模型用伦敦的人口来预测城市中的夜光分布情况[4]。



左边是模型预测的城市夜光分布,右边是伦敦真实的城市夜光分布图。其中黄色的位置灯光亮度高,绿色的位置亮度低。蓝色的区域是没有人口数据的地方。二者在大尺度上是非常吻合的。

粘性纽扣模型的生长可以完美的拟合真实的城市生长数据。比如,通过计算模型给出来纽扣网络总面积与城市人口呈现2/3的幂律关系;城市道路总长度与人口呈现5/6的幂律关系;而城市的人类社会经济活动总量(相当于是GDP、总财富)与人口呈现7/6的幂律关系。通过对比这些指数与Table1中的实际指数,就会发现它们的数值相差无几。更有意思的是,这些生长指数与模型的参数完全独立,也就是说可能北京和伦敦具有完全不同的空间分布特征或形态,但是它们的生长却要遵循相同的规律。


除此之外,这个粘性纽扣模型还能模拟多个城市构成城市群或城市系统的生长。让我们将试验的办法稍微改一下:我们仍然假设每次往地面上扔一颗纽扣。只不过如果纽扣没有被粘住的话,它不会掉到地上而消失,而是以一定的概率不消失。这样,这个被乱扔而不消失的纽扣就有可能形成一粒新的种子。

这种过程有什么意义呢?答案是,这样的多种子系统就可以模拟多个城市或城市系统的演化了。如下图所示[1,3]:

图中a展示的是美国中部地区城市夜光的分布图。b则展示的是纽扣模型生成的人造城市。其中每一个团块就是一堆纽扣搭建的网络,它们有大有小。从定性上看,除了模型生成的团块更加均匀对称以外,它们的统计性质几乎完全相同。右边的c和d就展示了真实与实际团块的统计性质比较。c展示的是团块总亮度与团块面积的关系,d图展示的是团块的尺度分布情况。


引申讨论


300年前,亚当斯密曾经在他的著作中提到了著名的“大头针工厂”之谜。他指出:

在大头针工厂中,每个人仅仅负责整个大头针生产工序的一部分,有的负责头部的生产,有的负责针尖,有的负责拉直,有的负责包装......。然而,这些人的整体效率却比他们单独生产大头针要高得多。

这段话非常清楚地描述了人类劳动分工的奥秘。如果我们将劳动分工看作一种多样性,而人类的合作看作是一种粘连或者连接的过程,那么黏性纽扣模型事实上正是在刻画人类劳动分工合作的过程。

无论是在虚拟的网络社区,还是在更大尺度上的城市。只要每一个个体人的能力有限,它只能感受部分信息,它的兴趣只能覆盖整个社区的一小部分,那么,纽扣的蘸粘生长的过程就可以作为很好的比喻。

进一步,如果我们在纽扣网络模型中引入竞争排斥机制,也就是不允许两个纽扣位于完全同样的位置,那么它还可以模拟人类的创新过程。我们都知道,过于超前的创新很容易死掉,这是因为整个纽扣网络还没有生长到那个合适的生态位。而过于落后的创新则由于竞争排斥作用,很容易被已有的纽扣所排挤。只有那些位于人类认知边沿上的创新才能更好地存在,并有机会获得大量的连接。

当然,这个模型也有很多尚不完善之处。例如,每个存在的纽扣永远不会消失,但实际的情况却是很多用户会退出社区。每个纽扣的大小是固定的,但实际中的不同人影响和感知力是有不同大小的。这些都为进一步扩充该模型奠定了基础。

开放性


越是简单的系统,就越是有可能生长出复杂的机能出来。同样的道理,越是简单的模型,它的可扩充性也就越强。有理由相信,粘性纽扣这个模型可以扩充解决更多的问题。但我不想把扩充这个模型的机会留给自己,而是希望大家在此基础上尽情地进行发挥。我已经把这个模型的Python源代码放到了这里:http://wiki.swarma.net/index.php/%E5%8C%B9%E9%85%8D%E7%94%9F%E9%95%BF%E9%9A%8F%E6%9C%BA%E5%87%A0%E4%BD%95%E5%9B%BE%E6%A8%A1%E5%9E%8B

如果你有好的扩展思路,请与我联系。


参考文献


[1] Jiang Zhang,Xintong Li,Xinran Wang, Wen-xu Wang, Lingfei Wu: Scaling behaviours in the growth of networked systems and their geometric origins; SCIENTIFIC REPORTS 2015, 5: 9767 --- 这个模型的原始论文

[2] Luís, M. A. Bettencourt*; José Lobo,Dirk Helbing,Christian Kühnert,Geoffrey B. West (2007). "Growth, innovation, scaling, and the pace of life in cities". PNAS 104 (17): 7301-7306.

[3] Xintong Li,Xinran Wang,Jiang Zhang, Lingfei Wu: Allometric scaling, size distribution and pattern formation of natural cities; Palgrave Communications, 1, 15017 (2015)

[4] Ruiqi Li, Lei Dong, Jiang Zhang, Xinran Wang and Wenxu Wang: Spatial scaling in cities: a unified model for population, road network, and socioeconomic interactions, submitted, 2015

编辑:Cancy


让苹果砸得更猛烈些吧!!!





长按识别二维码,关注集智俱乐部,

让我们离科学探索更近一步。











    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存