抖音大脑,与劣质多巴胺的狂飙时代
我们在前文讨论了学习的 what 问题(什么是学习)、学习的 how 问题(人,是如何学习的)。我们也部分讨论了学习的 why 问题(人生一切问题的根源,是你不会学习)。但是,why 问题是最重要的问题,学习的 why 问题不止是人生与学习的关系问题,更有一个巨大且可怕的现实是不可回避的:
我们身处一个“不会学习的代价无比巨大”的时代。
在工业革命前期,社会在科技、经济方面迎来巨大变革,人类所熟悉的生活面临巨大挑战。在这样的背景下,狄更斯在《双城记》开头写出了传世的语句:
这是最好的时代,这是最坏的时代;这是智慧的时代,这是愚蠢的时代;这是信仰的时期,这是怀疑的时期;这是光明的季节,这是黑暗的季节;这是希望之春,这是失望之冬;人们面前有着各样事物,人们面前一无所有;人们正在直登天堂,人们正在直下地狱。
100 多年后,我们站在AGI革命的黎明中,又一次面临相同的境遇:对于每个人来说,这是最好的时代,这也是最坏的时代。有的人直登天堂,有的人直下地狱。现在,我们要讨论的就是大脑和学习的“地狱景象”。
大脑的演化历程
首先,我们来看看“人脑”是怎么来的。
我们用600万年的时间从普通动物进化成现代[[智人]],而动物则是经过6亿年时间从蠕虫这样的简单生物进化出来的。人类学习的器官是大脑,而大脑经过了6亿年的进化过程,成为了宇宙中最复杂的生物组织。
三重大脑
如何理解这个复杂的大脑?
1960 年代,美国神经科学家保罗·麦克里恩(paul mclean)提出了简单但是有解释力的[[三重脑模型]](triune brain)[^ https://en.wikipedia.org/wiki/Triune_brain],把大脑发展划分为爬行脑、古哺乳动物脑以及新哺乳动物脑三个主要阶段。
先来看爬行动物脑。这种大脑被称为爬行脑(reptilian brain)或蜥蜴脑(lizard brain)。这种大脑是爬行动物、两栖动物、鱼类等生物就有的大脑。它掌管呼吸、心跳等本能反应,功能是维持生物在生理层面的生存本能。
然后,爬行动物一路演化,哺乳动物出现了。大脑是一种复杂器官,其演化模式并不是新大脑取代旧大脑,而是像叠罗汉一样,大脑会在旧结构的基础上叠加演化出具备更高级能力的新结构。
古哺乳动物脑的型结构被称为“古哺乳动物大脑组织” (Paleomammalian complex),mclean 用“边缘系统”(limbic system)来指代它,主要包括下丘脑、海马体、杏仁核等大脑组织。我把它称为[[动物脑]],这层大脑结构是非灵长类的低级哺乳动物就具备的,是小猫小狗都有的脑子,它让动物有自己的悲欢喜乐,掌管动物的情绪和恐惧反应。
随着灵长类动物的出现,大脑进一步复杂化,在演变出新皮层,mclean 称之为“新哺乳动物大脑组织”(Neomammalian complex)。大脑的第三层结构,我称之为“学习脑”,因为它是语言、抽象、计划、感知等高级认知能力的物质基础。
新皮层是高级哺乳动物才具有的,但是,人类的新皮层最发达,属于全地球独一家的存在:只有人类能学会使用工具,创造出自己的语言,发展出自己的经济政治文化与科学体系,建立了统治全球的人类文明。
三个大脑叠罗汉
大脑的演化,并不是高级结构取代低级结构,而是叠罗汉:在低级简单结构上演化出更高级更复杂的结构。
所以,人脑并不是全然100%理性思考的智能组织。理性的冰山之下,还有情绪、欲望和本能。所有这些,共同构成了人类的智能。人性是复杂,而叠罗汉的大脑就是这种复杂的物质基础。
所以,你的大脑其实有3个子系统,分为是小脑和脑干组成的“爬行脑”,边缘系统构成的“动物脑”,以及新皮质构成的、人科动物最发现、现代智人最引以为傲的”学习脑“。
情绪导向的、构成强烈视觉冲击的、引发愤怒共情的信息,会因为动物脑中的本能吸引你的注意力,立刻劫持人边缘系统中主管情绪的[[杏仁核]],刺激动物脑多巴胺回路疯狂分泌劣质多巴胺,让人沉迷成瘾。理性客观的、复杂克制的、逻辑严谨、严肃深奥的信息,必须在新皮质也就是「学习脑」才能进行信息处理。这是人类才有的强大学习能力。
晚熟的学习脑
好饭都是要等的,好脑子的成熟也是需要时间的。
虽然人类幼崽刚出生,脑壳里已然具备了爬行脑、动物脑和学习脑这三重结构,但是,高级大脑结构的发展和成熟是需要时间和训练的。甚至,学习脑中最重要的前额叶,要到25~30 岁才发展成熟。
前额叶被称为“大脑指挥官”,类似于电脑中的 CPU 加内存,除了负责信息的加工处理任务,工作记忆能力之外,还对应人脑的规划、监督、调整等高级认知能力。青少年的前额叶没有成熟,所以,青少年天然就容易冲动,难以自我控制,也容易被煽动和诱惑,这都是因为学习脑晚熟的缘故。这也是为何人类和其他所有动物不一样,有漫长的童年,需要进行长达十几年的学校教育。
可怕的(动物脑)学习
相对于前额叶的晚熟,动物脑却是早早就成熟的。
动物脑负责情绪反应,也更容易被激发和训练。我们前文都在讲“学习脑”的学习,但是,训练学习脑是一个漫长的、困难的、需要专注和耐心的过程,而训练动物脑则是缓慢的、容易的、不需要专注的过程。
我们生活在一个人类的动物脑被大规模训练的时代。动物脑的学习,已经发展到可怕的程度。这也是为什么一个人如果不能驾驭动物脑,会面临非常可怕的后果。当下,动物脑学习对学习脑的危害是广泛存在的,包括短视频、游戏、网文、过度娱乐等。下面,我们以短视频这个单一因素来认识一下动物脑学习的可怕现状。
先摆出一个结论:在前额叶成熟之前,青少年的学习脑很容易早早就被短视频算法“吃掉”了。
英语世界里对此有一个专门的概念来总结这种形象:tiktok brain。当儿童、青少年被tiktok短视频算法牢牢捕获之后,他们的注意力被分散、难以维持专注,也无法用足够的大脑资源去深入思考分析问题。当大脑的边缘系统被tiktok 攻陷之后,前额叶功能就越发低下,最终造成阅读、思考和创造等高级认知能力的逐渐丧失。
抖音大脑的big picture
抖音是如何给大脑“下毒”的?
我梳理了一个整体画面(big picture),从大脑神经机制的微观层面一直到社会的宏观层面:
短视频+个性化推荐算法 =》多巴胺狂飙 dopamine rush =》劣质多巴胺奖励回路 =》人脑对未来奖赏的折现系数调参,无限逼近于0 =》行为改变(即时满足),习惯巩固,大脑偏好建立 =》对大脑、学习、与人生的长期影响(丧失专注力,无法延迟满足)=》个人层面,塌陷式沉迷短视频,学习困难,丧失独立思考和解决人生问题的能力 =》社会层面,10 亿短视频用户,低智商社会,认知能力的丧失。
这个画面的背后,关键在于是否形成一个认识:
Tiktok的本质,是一个(劣质)多巴胺机器。
短视频算法对人类欲望曲线的学习
短视频app的核心是一套识别、迎合并训练人类兴趣的机器学习算法。
当你刚注册短视频 app 时,抖音会让你选择几个你感兴趣的主题。除了你主动选择的主题之外,算法对你是完全不了解的:你的年龄、性别、教育背景、家庭状况、兴趣爱好、人生状况、理想,以及欲望。所以,最初的首页信息流可以说是“千人一面”的,app 只能试探性的推荐平台上的热门视频给你,相对更随机。
但是,算法的学习是非常高效的。手机屏幕的格式天然是用来滑动(scroll)的:你的视线不动,停在屏幕上,手指通过上滑、停留、双击这几种有限动作来给算法提供信息。
如果你上滑,说明你对内容不感兴趣,大脑没分泌多巴胺;如果停留,说明你对内容感兴趣,大脑开始分泌多巴胺;如果双击,说明非常感兴趣,大脑疯狂分泌多巴胺(dopamine rush)。很快,短视频的首页信息流就从“千人一面”变成“千人千面”了,朋友聚会时,大家掏出自己的手机,一起来比较下各自的信息流推荐,这是我非常喜欢的游戏环节,乐趣无穷。
短视频的时长通常在15秒左右,最长不超过 1 分钟。这种形式从来就不是、也根本不可能传递任何智识性(intellectual)信息,但是对于算法来说,这是非常高效的学习:学习用户的兴趣,计算用户的欲望,衡量用户的多巴胺分泌。
报告显示,2022年10 亿短视频用户人均观看短视频 150 分钟,每天。假设每个短视频平均观看 15 秒,相当于每个人每天观看了 600 个短视频。用户对短视频的上滑停留与双击,就是算法的学习材料。通过每天 600 轮的学习,算法很快就把你的喜好摸的一清二楚,包括你的年龄、性别、教育背景、家庭状况、兴趣爱好、人生状况,算法给你推荐的视频越来越“个性化”,越来越能精准地刺激到你的动物脑,在刺激你的多巴胺分泌这件事上越来越高效。
于是,你的小手机,成了一个多巴胺机器。
劣质多巴胺研究
关于短视频算法对人类大脑影响的研究,是远远不够的。但是,少量的研究项目,都揭示出让人触目惊心的可怕画面。例
浙江大学教育学院心理与行为系的一项研究[^ Viewing personalized video clips recommended by TikTok activates default mode network and ventral tegmental area, https://doi.org/10.1016/j.neuroimage.2021.118136.],就清楚揭示了观看tiktok的个性化推荐视频带来的可怕影响。
一句话总结这项研究:观看算法推荐的个性化视频,大脑的腹侧被盖区(Ventral Tegmental Area, VTA)处于高度活跃的状态,动物脑疯狂分泌劣质多巴胺。
VTA是动物脑的一个重要结构,也是多巴胺神经元的“主要产地”,对于调节情绪、认知、奖励和动机至关重要。VTA 多巴胺神经元,在人脑奖励系统、动机、认知障碍和药物成瘾中发挥关键作用,一直以来都是成瘾问题和精神障碍的研究焦点。VTA能处理来自杏仁核的多种类型的情绪输出,尤其是焦虑、恐惧、欲望、新奇等强烈情绪。VTA区域的多巴胺神经元的放电激活模式,可以看作人脑中对奖赏的期望和欲望,堪称人的“欲望曲线”。
从 VTA 出发的多巴胺回路有多条,但最主要的是两条:前额叶多巴胺回路,动物脑多巴胺回路。人是追求奖赏、逃避惩罚的动物,而奖赏的背后都是多巴胺。但是,不同多巴胺回路所带来的奖赏,性质是完全不同的,我称之为“优质多巴胺”和“劣质多巴胺”。多巴胺本身并非罪恶之源,但是,不同性质的多巴胺,让有的人直上天堂,有的人直下地狱。
优质多巴胺来自前额叶参与,主要来自运动、阅读、学习、思考和解决问题等活动,这种活动通常更“慢”,给人带来健康向上的愉悦和快乐感受。
劣质多巴胺则不需要主动和深入的人类认知活动参与,直接刺激动物脑即可,主要来自短视频、网文、疯狂购物、网络上无脑谩骂等活动。在短视频的刺激下,VTA与杏仁核等边缘系统组织形成了“动物脑多巴胺回路”,疯狂供应这种劣质多巴胺。
从200 年前的鸦片成瘾,到现在美国的阿片类药物成瘾,到全世界的短视频成瘾,神经机制是一样的(我知道有数亿人不认可这个观点,whatever),本质上都是同一种劣质多巴胺成瘾而已。
抖音大脑的三阶段
亲爱的读者,你已经看到了抖音大脑的big picture,也了解了微观的神经机制,但是,实话说,成瘾是全人类全世界的共同问题,几百年来这种现象不但没有减少反而愈演愈烈。作为普通人,我们无力去改变世界,但是我们得自己照顾自己的生活,照顾自己的孩子。所以,我讨论“抖音大脑”的目的,只是为了论证个人层面的“人,为什么要学习”。
从个人层面看,短视频对大脑的影响可以分为三步:短视频奖赏大脑(reward)、短视频劫持大脑(hijack)、短视频损害大脑(damage)。
短视频奖赏大脑,是迅速的、高强度的,以秒为单位。短视频算法通过计算人类的欲望,精准刺激到动物脑多巴胺回路,造成劣质多巴胺在大脑里的狂飙,给人类用户创造出前所未见的“爽”体验。
短视频劫持大脑,是用户服用短视频的必然结果。当人们习惯性打开短视频 app,无脑滑动屏幕,人的行为模式会越来越牢固,最终每天在短视频上花费数个小时,用短视频填充生活中的每一个空隙,不论是等车还是排队,都要刷上手机,享受短视频带来的多巴胺奖赏。
而长期的结果,就是短视频损害大脑:注意力资源的被收割,注意力涣散,无法集中精力,无法阅读长文字,无法阅读严肃的书籍,失去深入思考和独立思考的能力,理性和审慎思考让位于情绪反应,前额叶功能低下,后皮质中的知识积累稀疏,无法建立个人知识体系,也没法培养分析、综合、创造等高级的认知能力。最终的表现,就是人之为人的认知能力的丧失。
《tiktok 算法 101》
这种现象,到底是一种无心插柳,还是有人在有意为之呢?
2021年12月,《纽约时报》发表了一篇文章[^ tiktok 是如何让你上瘾的,https://www.nytimes.com/2021/12/05/business/media/tiktok-algorithm.html],首次公开了tiktok 的内部算法。这个算法来自匿名人士的爆料,是抖音内部的“学习”文件。
文件清楚展示了抖音算法的目标:DAU(日活用户数)以及用户时长(time spent/retention)。不论是发视频的视频发布者,还是看视频的普通用户,抖音精心设计和量化的各种指标,都是为了一个目标:用户总时长的最大化。也就是说,用户注意力资源的最大化收割。
内容对用户有何影响?这个机制如何改变用户的大脑结构?如何改变用户的生活?这种关键问题根本不在考虑范围(因为人家自己不用,自己的孩子也不用的)。
文件还展示了一个简略的推荐算法:P点赞 x V点赞+P评论 x V评论+E播放时长 x V播放时长+P播放 x V播放
Plike X Vlike + Pcomment X Vcomment + Eplaytime X Vplaytime + Pplay X Vplay
你可能会觉得这个算法很简单,平淡无奇,但是,每一个视频都根据你的停留、点赞、评论、播放时长来量化,通过高频、海量的“学习”,这个算法可以精准地“逼近你的欲望曲线”,“训练你的植物性神经系统”,让你沉迷其中,无法自拔。
马斯克为何停用tiktok?
2023年11月,在一次大会访谈中,主持人询问马斯克是否使用tiktok[^ https://www.foxbusiness.com/business-leaders/elon-musk-says-felt-tiktok-probing-mind-platform-rife-antisemitic-content]。
马斯克回答说,他现在不用 tiktok 了。
我停止使用 tiktok 了。我发现AI在不断探测我的思想(probing my mind),这让我很不舒服,所以我就停用了。
马斯克认为 tiktok 算法是“完全 AI 驱动”(entirely AI-powered)的,它所做的事情只有一件:找到最有病毒性的内容,然后把你牢牢地粘在屏幕上。
与马斯克“英雄所见略同”的,还有张一鸣。神龙见首不见尾,张一鸣在整个互联网上的存在感,除了是抖音和 tiktok 的老板之外,最大的标签就是“延迟满足”。
很多人人生中一半的问题,都是因为没有延迟满足造成的。延迟满足感的本质是克服人性弱点,而克服弱点,是为了更多的自由。
吊诡且荒诞的是,抖音开创的短视频算法,其核心却是让人彻底丧失延迟满足的能力。
延迟满足与折现因子
“延迟满足”与“即时满足”都是看不见摸不着的。我们得通过强化学习理论中的一个抽象概念来加深自己的认识和理解:折现因子(discount factor),动物脑学习的一个关键概念。
在强化学习模型中,agent(智能体,动物或人)与环境不断发生交互,agent采取一个行为,环境给出一个反馈:奖励或惩罚。这是强化学习的基本过程。
而动物对未来奖励的折现率,这是强化学习的一个关键产物。折现因子是一个介于0和1之间的值,用符号 γ 表示。当 γ=0 时,算法只关注即时奖励,完全忽视未来奖励。当 γ 接近1时,算法在评估当前决策时会考虑较远未来的奖励,这意味着长期的回报变得更加重要。
当大脑中的折现系数足够低的时候,大多数用户都会选择去刷视频,享受当下的劣质多巴胺狂飙,而忽略学习和知识对人生的长远意义。因为,对于γ足够低的人,未来是看不见摸不着的,长远的奖励是比不过当下的愉悦。
而对于γ足够高的人,他会克制住长时间刷视频的欲望,而选择去读书、运动,通过优质多巴胺来获得健康的快乐,他能看到短视频等事物对长远人生的负面影响,并控制自己的冲动,调整自己的行为,做出长远的规划,并在当下采取有利于长远的行为。
自律的本质,是优质多巴胺
很多人憧憬“自律”的状态,在网络上像烧香拜佛一样到处寻找自律的秘诀,学了很多方法技巧,却最终很少有人真正做到“自律”。背后的原因是什么?为什么自律的技巧和秘诀不管用?
读到这里,你应该能看出来,归根结底是不理解自律的本质:
自律的本质,是优质多巴胺。
多巴胺不是坏东西,多巴胺是一切奖赏的来源,而人在本质上是追求奖赏、逃避惩罚的动物。我现在有幸陪伴小树共同成长,我看着她自己定早上 6 点半的闹钟,在上学前还要自己读书一小时,每天早上起床之后,睁眼之后 1 分钟以内一定就开始读书了。我经常惊叹,这么会有这样的孩子?要不是自己的孩子是这样的,我还真不知道会有这样的孩子存在。
有一天早上,小树在沙发上读书,我忽然想到,所谓的自律,本质上不过是多巴胺的来源决定的。
人脑的多巴胺回路主要就两条,一条是健康的,一条是不健康的。如果一个人建立了健康的多巴胺回路,习惯从阅读、运动、爱与情感中获得优质多巴胺的奖赏,她很自然就热爱学习,热爱生活,每天都很快乐。她不会沉陷于低级趣味的、劣质的、肤浅的娱乐,她有自己的精神世界,有自己的快乐源泉。
做一个对孩子负责的父母,要义就是为孩子创造一个健康的多巴胺环境。
对比之下,很多人因为外在压力,因为环境的潜移默化,自身也没有付出足够且有效的努力,最终被劣质多巴胺的力量打败,成为了劣质多巴胺的奴隶,成为可怕的动物脑学习的奴隶。对于这样的人,自律是困难的,这是在大脑神经机制、在多巴胺原理层面决定的。
下回预告
本来说好“下回写如何使用本书”的,但是,我今天还是回到了学习的why问题。因为学习的why,不但得正着说(人生问题与学习问题),还得反着说(认识动物脑学习的可怕现实),希望对你有帮助。
这是第一版的稿子,我每天的脑力有限,细节文字不太有力气推敲,在出版前我会仔细琢磨。感谢理解。
下回更新,我结束总论部分。