如何高效入门复杂系统仿真？

Original 王树义老师玉树芝兰 2022-05-20

王树义

读完需要

18分钟

速读仅需 6 分钟

推荐你一门好课，帮你在研究方法武器库中，添上复杂系统仿真这一项。

方法

提到研究方法，根据你所在学科的不同，一定能想到不同的名词。

学理工科的，可能会想到实验法。

学社会科学的，可能会想到问卷调查、访谈等。

这里，我给你介绍一种稍稍另类的研究方法——复杂系统仿真。

1948 年，美国数学家，信息论的创始人之一 Warren Weaver 提出了 3 类科学问题划分。

这三类问题分别是：

简单问题
无组织复杂问题
有组织复杂问题

所谓简单问题，就是研究少数变量之间的关系。例如你中学物理课学到过的，描述电阻、电压和电流关联的欧姆定律。这一类问题，到了 19 世纪末，就已经能够被解决了。

所谓无组织复杂问题，是指研究对象变量非常多，但是这些变量之间没有强联系，因此可以被近似当做一个整体来简单化处理。

例如气压，它源自于数千亿无组织空气分子的运动。温度和气压之间，是存在关联的。

但是，我们要理解气压和温度之间的关系，是不需要一一考察那无数分子的个体情况，只需要把气压当成一个总体来处理就好。这类的问题，到了 20 世纪中叶，也都获得了解决。

聪明的你，一定已经想到了这最后一类"有组织复杂问题"的定义了。

没错，如果我们的研究对象包括许多变量，而这些变量之间的关系不是微弱的，而恰恰是一种研究者不喜欢看到的"强非线性"关联，那么这类问题，就叫做有组织复杂问题。

例如，小麦的价格如何确定？货币如何有效、明智与稳定地投放？

这些问题，历史上有无数的聪明人，希望通过明确的数学公式来一劳永逸地解决它们。但是尝试过后，效果很不理想。

更要命的是，我们生活的社会里，越是与真实情况相近的问题，就越是具备有组织复杂问题的特性。不信你可以问问企业的管理者。

那么，面对这样的问题，我们该怎么办呢？

社会实验肯定是解决的有效方法之一。就如同历史上那些伟大的社会实验，例如：

六度分割实验
权威服从实验

问题是，不是什么时候，我们都可以选择社会实验法的。这里就会涉及到科研伦理问题。

例如说，我们要研究灾难发生时候逃生通道的情况，以便更好地设计安全的场馆；我们要研究病毒的传播路径，以便更好地防控疫情。

这种灾难，显然不能在真实场景中进行实验，否则后果不堪设想。

这就需要复杂系统仿真方法出场了。

仿真

什么叫做仿真呢？

就是用一个模型，来模拟真实世界的情况，给出一个近似结果。

仿真方法不稀奇。就连数学上概率问题的抛硬币，你都可以用 R 语言来轻易实现一个仿真。

以上抛硬币仿真代码来自这个地址。

但是问题在于，对于复杂系统的仿真，和它是有区别的。

前面提到了，复杂系统的特性，是变量多，而且具有强非线性关联。

因此，这种仿真，对工具是有要求的。即

能够描摹个体的特性与行为
能够刻画个体之间随时间步发生的交互作用

当然，如果你是高手，完全可以随便找来一种高级语言，从头开发自己的仿真工具。就如同有些高手，一言不合，就喜欢拿起汇编语言自己编程玩儿。

但是，这显然不适合普通人。

作为普通人来说，我们最好还是使用别人搭建好的仿真框架，在上面运行求解自己感兴趣的问题。

我做硕士毕业论文的时候，曾经使用过 Sante Fe 研究所开发的 Swarm 仿真工具，模拟无线局域网络中，通过作弊方式获得高带宽的用户行为。

不过，当时的学习过程很痛苦。因为 Sante Fe 研究所选用了一门当时非常冷门的语言作为 Swarm 的编程语言。

好在风水轮流转。后来，你可能听说了，这门语言被 Apple 看上了，一度成了开发 iOS App 的默认语言，又火了起来。

只是那时候，我已经把好不容易学会的这门语言，给忘得差不多了。惭愧。

不过，Swarm 确实不适合普通人来入门复杂系统仿真，使用起来也不是很方便。正如我在《学 Python ，能提升你的竞争力吗？》一文中跟你提过的。一门语言本身好坏固然重要，但更重要的，是网络效应，也就是有多少人愿意用。

有良好的社区，你就能很容易学习，遇到问题也容易从同侪那里找到答案；有新的需求，也会有更多的可能获得积极响应和改善。

所以后来，当我发现 Netlogo 的时候，很开心。

工具

和 Swarm 不同，Netlogo 一上来的定位，就是让更多人，特别是非专业编程人员，也能很容易上手复杂系统仿真。

究竟有多容易呢？

这么说吧。你连安装软件都不需要。

只要有一个浏览器，你就可以在里面输入这个链接：

https://www.netlogoweb.org/launch

然后，就能欢快地使用了。

方便吧？

不但功能齐全，Netlogo 还具有非常丰富的文档。

更让人兴奋的是，各种学科的模型样例，都很齐全。这是长年以来，社区日积月累的结果。

如果你要研究的问题，跟这些已经做好的模型相似，那么你只需要修改一下模型，就可以用于自己的研究。

我之前做教育部项目，研究虚假信息传播的机制模型与应对策略。其中一篇研究成果《基于复杂系统仿真的微博客虚假信息扩散模型研究》，用的基础就是 Netlogo 中的计算机病毒传播模型。

里面模型运行出来，是这样的：

看到这里，你可能早已跃跃欲试了。

别忙，刚才告诉你的，都是好消息那一面。

坏消息是，Netlogo 的语法，非常古怪。

对于从来没有接触过编程的人，困难在于模型一旦复杂化，阅读理解会有些困扰。

然而对他们来说，这种语法的怪异倒还好。他们的背景知识空缺，犹如一张白纸，往上面挥毫泼墨，还算容易。只要功夫深，铁杵磨成针。还是可以通过长期学习和反复练习来增强弥补。

怕就怕你之前学过 C, Java, Javascript 或者 Python 这样的高级语言。那初学 Netlogo 的时候，真的会让你有苦不堪言之感。

你直觉上正确的语句，写出来几乎全都是错的。

那感觉，肯定是不怎么样。

为什么会这样呢？

因为 Netlogo 看似一个玩具语言，简简单单。但是你千万不要被它的表象迷惑住。它属于编程语言里一个非常古老而奇异的家族——Lisp。

这个语言的其他亲戚，学起来也会让你觉得不那么直观。

例如下面这段：

所以著名的漫画 XKCD 系列里面，是这样揶揄 Lisp 的：

但是，长得怪不要紧。Lisp 这个语言家族的功能非常强大。

如果你掌握了其精髓，那便如同会用了独孤九剑。逢强则强，变化无穷。

问题的关键，在于你如何学习它。

教程

Netlogo 的教程，一直都很稀缺。那些真正的专家，往往会过度低估 Netlogo 的入门和上手难度，只是希望把它作为工具，介绍复杂系统研究。

例如 Melanie Mitchell 的课程，便是如此。

在这些课程里，Netlogo 会被广泛用到，但是其功能使用的细节，不作为重点，很多地方一带而过。你听着挺清楚，自己如果想要实践，或者需要定制修改模型，还是会一头雾水。

直到 2015 年，Netlogo 的作者 Uri Wilensky，和 Bill Rand 合作，才出了一本真正意义上的权威入门教程。我当时在美国访学，书刚一出版就从亚马逊下单，买了一本，背了回来。挺沉的。

说是入门教程，也确实介绍了一些 Netlogo 的使用方法，但作者依然是把重点放在了介绍 Netlogo 在各种领域的研究应用上。

更大的问题是，纸质的书籍，不适合做动态的讲解。你图截得太多，显得冗余而凌乱。图截得太少，可能会漏掉重要的步骤。一切都靠读者领悟，读者学习的认知负荷就过高了。

学习的过程中，依然有很多闹不明白的地方。尤其是那些在其他编程语言里，习以为常的东西。所以我不得不经常跳脱出来，到网上查询各种解法和经验。

例如方括号和圆括号的使用，我就是看了这个帖子，才明白，还特意剪藏到了 evernote 中。

连个括号使用，用户都会有这么多的疑问，以至于需要专门有人写个帖子来答复。Netlogo 使用中坑洼之多，可见一斑。

后来书的作者之一 Bill Rand 在 Sante Fe 的 Complexity Explorer 平台开设了一门 MOOC ，介绍复杂系统仿真。我欣然加入学习，还获得了证书。

有了这些教学材料作为基础，我试图在自己的《网络传播与舆情分析》课上，给研究生们介绍基于 Netlogo 的复杂系统仿真，以期让他们能够多掌握一种不同的研究方法，以便选题时视野更加宽广。

但是，这一部分花了精力不小，收获却不大。

因为学生们学起来困难重重。

起初的上手教程，编个蚂蚁觅食，他们还是玩儿得不亦乐乎的。

刚开始选练习题目的时候，也还算积极。

但是一旦深入到了后面的复杂网络动力学部分，就基本上不求甚解，连蒙带猜了。

为什么呢？

你可能想到了——英语不过关。

我推荐作为辅助材料的 Netlogo 视频教程，都是英文的。学的时候，他们已经有好多地方跟不上，得反复回放了。

到了练习中，遇到一些新函数，或者是方法的组合，都需要查资料。而资料里绝大部分，也都是英文的。

虽然我教给了他们如何查询编程手册，但是手册里面的使用方法，往往和实际应用里面的用法有区别。对于初学者来说，这不是很容易处理。

我就一直在想，如果能有一套中文教程，循序渐进介绍 Netlogo 的基础用法，把常见的坑一一指出。然后再进一步，把避坑的方法娓娓道来，那该多好？

我曾经也想过自己做一套这样的教程，但是确实没有足够的时间和毅力。

所以，当我看到集智学园出的这一套中文 Netlogo 教程时，非常惊喜。

介绍

这部教程的作者，是集智学园的创始人，北京师范大学张江教授。

张老师的课程，有一个特别好的地方，就是给那些曾经学过高级语言的人，讲了讲 Netlogo 奇怪语法与它们的区别。

我曾经就是在这里，被卡得一塌糊涂。

因为实在是不适应。

他上来就说，为了学好 Netlogo ，你得忘掉之前学的一切其他语言的语法，或者学会翻译它们。

你看，这就是个教程里展示"翻译"的样例：

你可以学会用十几行代码，就构造出朗顿蚂蚁模型。

然后，亲眼见证 10000 步左右涌现出的"高速公路"效果。

你还可以通过最简单的"羊-草"生态模型，了解语句的上下文关系。

对于每一个步骤，张老师都给出了非常清晰地介绍和图示。尤其是对重难点做了非常细致的总结和梳理。

通过一个简单的经济模型，你可以了解如何绘制动态直方图。

甚至更进一步，用另一张图，动态绘制洛伦兹曲线。

更妙的是，当我们需要考虑多个变量的交互影响或者综合因素时，还可以使用 Netlogo 给我们提供的简便实验环境 behavior space。

在使用中，每一步都有详细的介绍说明。使得你也可以让机器高速工作，帮你在短短的几分钟里面，做 2000 轮的实验。

最终的结果，还能非常方便地导出。

怎么样？是不是觉得学这样一套教程，很有意义啊？

你一定很关心价格吧？

没错，集智学园里面，有些课程确实要价不菲。

但是这一门课程，是免费的。

它是集智学园“防疫助力”课程的一部分。这一板块里面全部课程，你目前都可以免费学习。

怎么样？

是不是觉得这个漫长的假期，有事儿可做了呢？

小结

本文为你介绍了以下知识点：

研究问题按照复杂度的分类方式；
复杂系统研究的方法，尤其是仿真方法的必要性和应用场景；
复杂系统仿真的工具 Netlogo 及其特点；
入门 Netlogo 的优秀中文免费课程资源。

抓紧学习吧。

我这样说，不是因为我当老师，有督促你学习的职业病。而是有经验教训的。

2003 年，我上大三的时候，曾经和许多同学一样，在一个周末，被学校要求在家自我隔离。

当时我做的事儿，是把几年积攒下来的 DVD 看了个遍，很开心。

但是，等到 6 月份宣布恢复上课和考试的时候，我就傻眼了。前几天回看当时的日记，充满了惶恐与悔恨。

要知道，其他同学在家里，利用那宝贵的假期时间，把互联网协议，就是那一堆 RFC 文件，从头到尾读了一遍。

希望你，能珍惜眼前的时光，做到停课不停学。用这些优秀的教程，填充你的知识结构，增长自己的见识和实力。

公众号后台回复“netlogo”，就可以获得课程链接等资料。

祝学习愉快！

感觉有用的话，请点“在看”，并且把它转发给你身边有需要的朋友。

赞赏就是力量。

由于微信公众号外部链接的限制，文中的部分链接可能无法正确打开。如有需要，请点击文末的“阅读原文”按钮，访问可以正常显示外链的版本。

订阅我的微信公众号“玉树芝兰”，第一时间免费收到文章更新。别忘了加星标，以免错过新推送提示。

如果你对 Python 与数据科学感兴趣，希望能与其他热爱学习的小伙伴一起讨论切磋，答疑解惑，欢迎加入知识星球。

延伸阅读

你可能也会对以下话题感兴趣。点击链接就可以查看。

如何高效读论文？
如何快速写作论文初稿？
文科生用机器学习做论文，该写些什么？
如何用人工智能帮你找论文？
如何选研究题目？
如何高效学 Python？

题图： Photo by Moon on Unsplash

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

“四川大学姜涛与爱人程月玲”，你们现在还好吗？

为了这部描述从“反右”到“文革”的禁片，田壮壮付出了十年不能拍片的代价

关于字节基建

李宜雪的良知卖了2万元，真正需要声援的是罗灿宏啊

如何高效入门复杂系统仿真？

您可能也对以下帖子感兴趣

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

“四川大学姜涛与爱人程月玲”，你们现在还好吗？

为了这部描述从“反右”到“文革”的禁片，田壮壮付出了十年不能拍片的代价

关于字节基建

李宜雪的良知卖了2万元，真正需要声援的是罗灿宏啊

生成图片，分享到微信朋友圈

如何高效入门复杂系统仿真？

您可能也对以下帖子感兴趣