查看原文
其他

如何高效入门复杂系统仿真?

王树义老师 玉树芝兰 2022-05-20

王树义

读完需要

18分钟

速读仅需 6 分钟

推荐你一门好课,帮你在研究方法武器库中,添上复杂系统仿真这一项。

1


   

方法

提到研究方法,根据你所在学科的不同,一定能想到不同的名词。

学理工科的,可能会想到实验法。

学社会科学的,可能会想到问卷调查、访谈等。

这里,我给你介绍一种稍稍另类的研究方法——复杂系统仿真。

1948 年,美国数学家,信息论的创始人之一 Warren Weaver 提出了 3 类科学问题划分。

这三类问题分别是:

  • 简单问题

  • 无组织复杂问题

  • 有组织复杂问题

所谓简单问题,就是研究少数变量之间的关系。例如你中学物理课学到过的,描述电阻、电压和电流关联的欧姆定律。这一类问题,到了 19 世纪末,就已经能够被解决了。

所谓无组织复杂问题,是指研究对象变量非常多,但是这些变量之间没有强联系,因此可以被近似当做一个整体来简单化处理。

例如气压,它源自于数千亿无组织空气分子的运动。温度和气压之间,是存在关联的。

但是,我们要理解气压和温度之间的关系,是不需要一一考察那无数分子的个体情况,只需要把气压当成一个总体来处理就好。这类的问题,到了 20 世纪中叶,也都获得了解决。

聪明的你,一定已经想到了这最后一类"有组织复杂问题"的定义了。

没错,如果我们的研究对象包括许多变量,而这些变量之间的关系不是微弱的,而恰恰是一种研究者不喜欢看到的"强非线性"关联,那么这类问题,就叫做有组织复杂问题。

例如,小麦的价格如何确定?货币如何有效、明智与稳定地投放?

这些问题,历史上有无数的聪明人,希望通过明确的数学公式来一劳永逸地解决它们。但是尝试过后,效果很不理想。

更要命的是,我们生活的社会里,越是与真实情况相近的问题,就越是具备有组织复杂问题的特性。不信你可以问问企业的管理者。

那么,面对这样的问题,我们该怎么办呢?

社会实验肯定是解决的有效方法之一。就如同历史上那些伟大的社会实验,例如:

  • 六度分割实验

  • 权威服从实验

问题是,不是什么时候,我们都可以选择社会实验法的。这里就会涉及到科研伦理问题。

例如说,我们要研究灾难发生时候逃生通道的情况,以便更好地设计安全的场馆;我们要研究病毒的传播路径,以便更好地防控疫情。

这种灾难,显然不能在真实场景中进行实验,否则后果不堪设想。

这就需要复杂系统仿真方法出场了。

2


   

仿真

什么叫做仿真呢?

就是用一个模型,来模拟真实世界的情况,给出一个近似结果。

仿真方法不稀奇。就连数学上概率问题的抛硬币,你都可以用 R 语言来轻易实现一个仿真。

以上抛硬币仿真代码来自这个地址。

但是问题在于,对于复杂系统的仿真,和它是有区别的。

前面提到了,复杂系统的特性,是变量多,而且具有强非线性关联。

因此,这种仿真,对工具是有要求的。即

  • 能够描摹个体的特性与行为

  • 能够刻画个体之间随时间步发生的交互作用

当然,如果你是高手,完全可以随便找来一种高级语言,从头开发自己的仿真工具。就如同有些高手,一言不合,就喜欢拿起汇编语言自己编程玩儿。

但是,这显然不适合普通人。

作为普通人来说,我们最好还是使用别人搭建好的仿真框架,在上面运行求解自己感兴趣的问题。

我做硕士毕业论文的时候,曾经使用过 Sante Fe 研究所开发的 Swarm 仿真工具,模拟无线局域网络中,通过作弊方式获得高带宽的用户行为。

不过,当时的学习过程很痛苦。因为 Sante Fe 研究所选用了一门当时非常冷门的语言作为 Swarm 的编程语言。

好在风水轮流转。后来,你可能听说了,这门语言被 Apple 看上了,一度成了开发 iOS App 的默认语言,又火了起来。

只是那时候,我已经把好不容易学会的这门语言,给忘得差不多了。惭愧。

不过,Swarm 确实不适合普通人来入门复杂系统仿真,使用起来也不是很方便。正如我在《学 Python ,能提升你的竞争力吗?》一文中跟你提过的。一门语言本身好坏固然重要,但更重要的,是网络效应,也就是有多少人愿意用。

有良好的社区,你就能很容易学习,遇到问题也容易从同侪那里找到答案;有新的需求,也会有更多的可能获得积极响应和改善。

所以后来,当我发现 Netlogo 的时候,很开心。

3


   

工具

和 Swarm 不同,Netlogo 一上来的定位,就是让更多人,特别是非专业编程人员,也能很容易上手复杂系统仿真。

究竟有多容易呢?

这么说吧。你连安装软件都不需要。

只要有一个浏览器,你就可以在里面输入这个链接:

https://www.netlogoweb.org/launch

然后,就能欢快地使用了。

方便吧?

不但功能齐全,Netlogo 还具有非常丰富的文档。

更让人兴奋的是,各种学科的模型样例,都很齐全。这是长年以来,社区日积月累的结果。

如果你要研究的问题,跟这些已经做好的模型相似,那么你只需要修改一下模型,就可以用于自己的研究。

我之前做教育部项目,研究虚假信息传播的机制模型与应对策略。其中一篇研究成果《基于复杂系统仿真的微博客虚假信息扩散模型研究》,用的基础就是 Netlogo 中的计算机病毒传播模型。

里面模型运行出来,是这样的:

看到这里,你可能早已跃跃欲试了。

别忙,刚才告诉你的,都是好消息那一面。

坏消息是,Netlogo 的语法,非常古怪。

对于从来没有接触过编程的人,困难在于模型一旦复杂化,阅读理解会有些困扰。

然而对他们来说,这种语法的怪异倒还好。他们的背景知识空缺,犹如一张白纸,往上面挥毫泼墨,还算容易。只要功夫深,铁杵磨成针。还是可以通过长期学习和反复练习来增强弥补。

怕就怕你之前学过 C, Java, Javascript 或者 Python 这样的高级语言。那初学 Netlogo 的时候,真的会让你有苦不堪言之感。

你直觉上正确的语句,写出来几乎全都是错的。

那感觉,肯定是不怎么样。

为什么会这样呢?

因为 Netlogo 看似一个玩具语言,简简单单。但是你千万不要被它的表象迷惑住。它属于编程语言里一个非常古老而奇异的家族——Lisp。

这个语言的其他亲戚,学起来也会让你觉得不那么直观。

例如下面这段:

所以著名的漫画 XKCD 系列里面,是这样揶揄 Lisp 的:

但是,长得怪不要紧。Lisp 这个语言家族的功能非常强大。

如果你掌握了其精髓,那便如同会用了独孤九剑。逢强则强,变化无穷。

问题的关键,在于你如何学习它。

4


   

教程

Netlogo 的教程,一直都很稀缺。那些真正的专家,往往会过度低估 Netlogo 的入门和上手难度,只是希望把它作为工具,介绍复杂系统研究。

例如 Melanie Mitchell 的课程,便是如此。

在这些课程里,Netlogo 会被广泛用到,但是其功能使用的细节,不作为重点,很多地方一带而过。你听着挺清楚,自己如果想要实践,或者需要定制修改模型,还是会一头雾水。

直到 2015 年,Netlogo 的作者 Uri Wilensky,和 Bill Rand 合作,才出了一本真正意义上的权威入门教程。我当时在美国访学,书刚一出版就从亚马逊下单,买了一本,背了回来。挺沉的。

说是入门教程,也确实介绍了一些 Netlogo 的使用方法,但作者依然是把重点放在了介绍 Netlogo 在各种领域的研究应用上。

更大的问题是,纸质的书籍,不适合做动态的讲解。你图截得太多,显得冗余而凌乱。图截得太少,可能会漏掉重要的步骤。一切都靠读者领悟,读者学习的认知负荷就过高了。

学习的过程中,依然有很多闹不明白的地方。尤其是那些在其他编程语言里,习以为常的东西。所以我不得不经常跳脱出来,到网上查询各种解法和经验。

例如方括号和圆括号的使用,我就是看了这个帖子,才明白,还特意剪藏到了 evernote 中。

连个括号使用,用户都会有这么多的疑问,以至于需要专门有人写个帖子来答复。Netlogo 使用中坑洼之多,可见一斑。

后来书的作者之一 Bill Rand 在 Sante Fe 的 Complexity Explorer 平台开设了一门 MOOC ,介绍复杂系统仿真。我欣然加入学习,还获得了证书。

有了这些教学材料作为基础,我试图在自己的《网络传播与舆情分析》课上,给研究生们介绍基于 Netlogo 的复杂系统仿真,以期让他们能够多掌握一种不同的研究方法,以便选题时视野更加宽广。

但是,这一部分花了精力不小,收获却不大。

因为学生们学起来困难重重。

起初的上手教程,编个蚂蚁觅食,他们还是玩儿得不亦乐乎的。

刚开始选练习题目的时候,也还算积极。

但是一旦深入到了后面的复杂网络动力学部分,就基本上不求甚解,连蒙带猜了。

为什么呢?

你可能想到了——英语不过关。

我推荐作为辅助材料的 Netlogo 视频教程,都是英文的。学的时候,他们已经有好多地方跟不上,得反复回放了。

到了练习中,遇到一些新函数,或者是方法的组合,都需要查资料。而资料里绝大部分,也都是英文的。

虽然我教给了他们如何查询编程手册,但是手册里面的使用方法,往往和实际应用里面的用法有区别。对于初学者来说,这不是很容易处理。

我就一直在想,如果能有一套中文教程,循序渐进介绍 Netlogo 的基础用法,把常见的坑一一指出。然后再进一步,把避坑的方法娓娓道来,那该多好?

我曾经也想过自己做一套这样的教程,但是确实没有足够的时间和毅力。

所以,当我看到集智学园出的这一套中文 Netlogo 教程时,非常惊喜。

5


   

介绍

这部教程的作者,是集智学园的创始人,北京师范大学张江教授。

张老师的课程,有一个特别好的地方,就是给那些曾经学过高级语言的人,讲了讲 Netlogo 奇怪语法与它们的区别。

我曾经就是在这里,被卡得一塌糊涂。

因为实在是不适应。

他上来就说,为了学好 Netlogo ,你得忘掉之前学的一切其他语言的语法,或者学会翻译它们。

你看,这就是个教程里展示"翻译"的样例:

你可以学会用十几行代码,就构造出朗顿蚂蚁模型。

然后,亲眼见证 10000 步左右涌现出的"高速公路"效果。

你还可以通过最简单的"羊-草"生态模型,了解语句的上下文关系。

对于每一个步骤,张老师都给出了非常清晰地介绍和图示。尤其是对重难点做了非常细致的总结和梳理。

通过一个简单的经济模型,你可以了解如何绘制动态直方图。

甚至更进一步,用另一张图,动态绘制洛伦兹曲线。

更妙的是,当我们需要考虑多个变量的交互影响或者综合因素时,还可以使用 Netlogo 给我们提供的简便实验环境 behavior space。

在使用中,每一步都有详细的介绍说明。使得你也可以让机器高速工作,帮你在短短的几分钟里面,做 2000 轮的实验。

最终的结果,还能非常方便地导出。

怎么样?是不是觉得学这样一套教程,很有意义啊?

你一定很关心价格吧?

没错,集智学园里面,有些课程确实要价不菲。

但是这一门课程,是免费的。

它是集智学园“防疫助力”课程的一部分。这一板块里面全部课程,你目前都可以免费学习。

怎么样?

是不是觉得这个漫长的假期,有事儿可做了呢?

6


   

小结

本文为你介绍了以下知识点:

  • 研究问题按照复杂度的分类方式;

  • 复杂系统研究的方法,尤其是仿真方法的必要性和应用场景;

  • 复杂系统仿真的工具 Netlogo 及其特点;

  • 入门 Netlogo 的优秀中文免费课程资源。

抓紧学习吧。

我这样说,不是因为我当老师,有督促你学习的职业病。而是有经验教训的。

2003 年,我上大三的时候,曾经和许多同学一样,在一个周末,被学校要求在家自我隔离。

当时我做的事儿,是把几年积攒下来的 DVD 看了个遍,很开心。

但是,等到 6 月份宣布恢复上课和考试的时候,我就傻眼了。前几天回看当时的日记,充满了惶恐与悔恨。

要知道,其他同学在家里,利用那宝贵的假期时间,把互联网协议,就是那一堆 RFC 文件,从头到尾读了一遍。

希望你,能珍惜眼前的时光,做到停课不停学。用这些优秀的教程,填充你的知识结构,增长自己的见识和实力。

公众号后台回复“netlogo”,就可以获得课程链接等资料。

祝学习愉快!

感觉有用的话,请点“在看”,并且把它转发给你身边有需要的朋友。

赞赏就是力量。

由于微信公众号外部链接的限制,文中的部分链接可能无法正确打开。如有需要,请点击文末的“阅读原文”按钮,访问可以正常显示外链的版本。

订阅我的微信公众号“玉树芝兰”,第一时间免费收到文章更新。别忘了加星标,以免错过新推送提示。

如果你对 Python 与数据科学感兴趣,希望能与其他热爱学习的小伙伴一起讨论切磋,答疑解惑,欢迎加入知识星球。

7


   

延伸阅读

你可能也会对以下话题感兴趣。点击链接就可以查看。


题图: Photo by Moon on Unsplash


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存