为什么理性选择研究范式经久不衰？| 名家讲座013：Elinor Ostrom

比较中的政治研究

2024-11-13

编者按

在经济学与政治学领域，理性选择理论一直是理解和预测个体及集体行为的核心工具。然而，Elinor Ostrom教授以其深刻的洞察力和广泛的实证研究，为我们揭示了一个事实：传统的理性选择模型虽具有持久的影响力，但在解释和指导现实世界中的集体行动时，其局限性已日益显现。Ostrom教授倡导一种行为学视角下的集体行动理性选择理论，这一革新视角不仅丰富了我们对人类社会协作的理解，也为政策制定与公民教育提供了崭新的启示。

面对社会困境这一政治科学的核心议题，Ostrom教授提出，我们需要超越第一代理性模型，发展第二代理性选择理论。这一理论不仅要考虑个体在面临社会困境时的有限理性和道德行为，还要深入探究个体如何通过面对面沟通、信任构建、声誉维护以及遵循互惠规范来实现集体行动。她指出，实验研究在检验理论假设和解析变量互动方面具有独特优势，与实地研究相结合，将推动政治科学在理解人类行为与制度影响方面取得更为坚实且快速的进展。

政策层面，对国家角色的认识将因更宽泛的理性理论而发生转变。国家不再是唯一解决社会困境的外部权威，而应视为个体通过启发式和规范自我解决问题，乃至创建新结构安排以应对复杂挑战的合作伙伴。政府在国防、货币政策、贸易政策等方面发挥关键作用，同时，也需尊重和支持公民通过互惠、自我组织的方式解决局部问题的能力。政策制定者需关注制度如何增强或限制信任、互惠与声誉的建立，防止过度监管导致信任瓦解，以及正式制度可能削弱个体对基于内在规范行动的价值认同。

公民教育层面，Ostrom教授呼吁我们反思当前教材过于聚焦领导人物、忽视普通公民在维护民主中的核心作用。她主张，教育应传授公民解决社会困境所需的技能与道德决策能力，培养具备互信精神而非愤世嫉俗的公民，以维护民主社会的稳定与繁荣。

总的来说，Ostrom教授的理论贡献揭示了集体行动理性选择理论的新维度：它不仅是对个体理性的机械运算，更是对人类行为复杂性、道德动机及社会互动的深刻洞察。这一行为学视角提醒我们，有效集体行动的构建并非宿命论的悲剧，而是充满可能性与选择的空间。它要求我们重新审视个体与国家的关系，提升公民教育的质量，以及借助跨学科研究方法深化对人类合作机制的理解。在21世纪全球关系日益交织的背景下，这样的理论创新对于确保社会和谐、环境保护以及民主政体的健康运行具有不可估量的价值。

为什么理性选择研究范式经久不衰？

（原标题为：《一种行为学视角下的集体行动理性选择理论（A Behavioral Approach to the Rational Choice Theory of Collective Action）》，现标题为译者所拟）

演讲者：

Elinor Ostrom（生于1933年8月7日，卒于2012年6月12日），诺贝尔经济学奖获得者（2009）、美国国家科学院院士、美国人文与科学院院士、美国公共选择学派的创始人之一、Johan Skytte 政治科学奖获得者（1999）、美国政治科学协会主席（1996-1997）、印第安纳大学政治科学系教授。她因在经济治理领域的工作，或经济体系和等级组织在市场之外运作的方式，与Oliver E. Williamson共同获得2009年诺贝尔经济学奖，成为第一位获得该奖的女性学者。

长期以来，经济学家们一致认为，由使用者集体使用的自然资源将被过度开发和破坏。Elinor Ostrom通过实地研究当地小社区的人们如何管理共有的自然资源（如牧场、捕鱼水域和森林），反驳了这一观点。她指出，当自然资源由使用者共同使用时，就会及时建立规则，规定如何以经济和生态可持续的方式来照顾和使用这些资源。这些研究主要汇集于她的主要著作之中，例如：Governing the Commons: The Evolution of Institutions for Collective Action (1990), Understanding Institutional Diversity (2005), Linking the Formal and Informal Economy: Concepts and Policies (2006), and Understanding Knowledge as a Commons: From Theory to Practice (2007)。

编译：

焦磊，山东大学

引文格式（MLA）：

OSTROM, ELINOR. “A Behavioral Approach to the Rational Choice Theory of Collective Action.” American Political Science Review, vol. 92, no. 1, 1998.

内容提要

大量的实证证据和多学科的理论发展催生了对拓展理性选择模型范围的需求，以作为研究社会困境与集体行动的基础。在对通过集体行动克服社会困境这一问题进行简要介绍后，本文剩余部分分为六个部分。第一部分简要回顾了当前被接受的理性选择理论关于社会困境的理论预测。第二部分总结了大量实验研究所提出的对完全依赖理性模型的挑战。第三部分讨论了两个主要的实证发现，它们开始揭示个体如何通过构建互惠、声誉和信任发挥作用的条件，来实现“超越理性”的结果，从而克服短期自我利益的强大诱惑。第四部分提出了发展第二代理性模型的可能性，第五部分构建了一个初步的理论情景，最后一部分通过考察将互惠、声誉和信任置于经实证检验的行为主义集体行动理论核心所产生的影响，得出结论。

让我以一个挑衅性的陈述开始。如果不是因为我们的某些祖先学会了如何采取集体行动来解决社会困境，你不会正在阅读这篇文章。后世不断积累关于如何在孩子中灌输有益的行为规范，以及制定支持产生公共物品、避免“公地悲剧”集体行动的规则的日常知识。然而，我们祖先和当代人关于为共同防御、养育子女和生存而进行集体行动的经验，并未被现有集体行动理论所理解或解释。

然而，集体行动理论是政治科学的核心主题。它是国家合法性的核心。集体行动问题渗透于国际关系之中，困扰着立法者在制定公共预算时，弥漫于公共官僚机构，并且是解释民主制度下投票、利益集团形成和公民控制政府的核心。如果政治科学家没有一个基于实证的集体行动理论，那么我们在面对核心问题时只是在空谈。我恐怕我们做了很多空谈。

有效集体行动的教训并不简单——从人类历史和我们经历的巨大悲剧，以及我们实现的成功来看，这一点显而易见。然而，随着全球关系变得越来越复杂交织，我们的生存越来越依赖于基于实证的科学理解。我们尚未根据关于个体在社会困境中如何做决策的实证证据，开发出一种行为主义的集体行动理论。如果我们想理解诸如面对面沟通为何如此一致地增强社会困境中的合作，或者结构变量如何促进或阻碍有效的集体行动等基本问题，那么对基于实证探究的理论的承诺至关重要。

社会困境在相互依存的情境中出现，当个体面临选择时，最大化短期自身利益会导致所有参与者比可行的替代方案更糟。例如，在一个公共物品困境中，所有从提供公共物品（如污染控制、广播或天气预报）中获益的人，都会觉得为此贡献成本高昂，宁愿别人为此付费。如果每个人都遵循均衡策略，那么该物品就不会被提供或被提供的不足。然而，如果每个人都能贡献，所有人都会更好。社会困境存在于生活的各个方面，导致影响战争与和平的重大决定，以及日常生活中信守诺言的琐碎关系。

社会困境有许多别名，包括公共物品或集体物品问题）、偷懒、搭便车问题、道德风险、可信承诺困境、一般化社会交换、公地悲剧，以及威胁和暴力对抗的交换。囚徒困境已成为当代学术界最著名的社会困境。被认为面临这类情况的个体类型包括政客、国际谈判者、立法者、经理、工人、长途贸易商、部长、寡头、工会组织者、革命者、房主，甚至啦啦队队长，当然还有我们所有人——每当我们考虑信任他人与我们在长期联合事业中合作时。

在史前时代，简单的生存既依赖于对自身利益的积极追求，也依赖于在防御、食物获取和育儿方面的集体行动。近亲之间的互惠被用来解决社会困境，导致那些生活在家庭中并在家庭内部使用互惠的个体具有更高的生存率。随着人类开始在社区定居并从事农业和长途贸易，与近亲以外的个体进行互惠的形式对于实现相互保护、获得长途贸易的好处、建设公共设施和保护共有资源至关重要。进化心理学家提供了大量证据，表明人类已经进化出了类似学习语言的能力，来学习互惠规范和社会规则，从而提高集体行动的收益。同时，认知科学家也表明，我们的遗传遗产并没有赋予我们在没有大量获得的知识和实践以及相关环境的可靠反馈的情况下进行无偏、复杂和全面分析的能力。试错方法被用来学习个人技能，以及增加个体通过专业化、协调和交换可能获得的联合回报的规则和程序。所有持久的政治哲学都认识到人性是追求自身利益与获得内在行为规范能力的复杂混合体，并在理解和认为这些规范和规则合法时遵守它们。我们的进化遗产使我们在寻求有限的自我利益的同时，有能力学习有助于实现成功集体行动的启发式和规范，如互惠。

当代社会科学中最强大的理论之一——理性选择理论——帮助我们将人类理解为追求自身利益的短期最大化者。完全理性的模型在预测竞争环境中边际行为方面非常成功，这种竞争环境筛选出不最大化外部价值（如竞争市场中的利润或政党竞争中的选举成功概率）的个体。但在一次性或有限重复的社会困境中，薄型的理性选择模型在解释或预测行为方面并不成功，理论预测在这种情况下没有人会合作。在无限期（或无限）重复的社会困境中，标准的理性选择模型预测了从最佳到最差的众多均衡状态，但没有假设个体如何可能实现更高效的结果并避免灾难的过程。来自实验的大量证据表明，大多数一次性或有限重复社会困境中的合作水平远高于预测水平，并且受到理论上对结果没有影响的变量的系统影响。实地研究还表明，个体系统地参与提供地方公共物品或管理共有资源的集体行动，而无需外部权威提供激励或施加制裁。仅仅假设个体使用长远思维“以实现建立和/或维持持续相互合作的目标”并不是一个充分的理论。它没有解释为什么有些群体无法轻易获得可获得的联合结果，或者为什么最初的合作者可能会破裂。

我们现在有足够的跨学科研究来扩展我们使用的理性选择模型的范围。出于至少五个原因，我们需要制定一个有限理性和道德行为的行为理论。

首先，社会困境中的行为受许多结构性变量的影响，包括群体规模、参与者异质性、他们对所获得利益的依赖程度、他们的贴现率、涉及的转化过程的类型和可预测性、组织层次的嵌套、监控技术以及参与者可获得的信息。在预测一次性或有限重复困境中要么零合作要么100%合作的理论中，结构性变量根本不影响合作水平。对结构性变量与个体解决社会困境可能性之间关系的连贯解释取决于发展有限理性选择的行为理论。这将使强调结构性解释人类行为的学者和强调个体选择的学者找到共同点，而不是继续关于结构性变量还是个体属性更重要的徒劳争论。

其次，所有社会科学和一些生物科学领域的学者都有活跃的研究项目，关注个体如何实现集体行动。一个得到实证支持的社会困境分析理论框架将整合并联系他们的努力。开发这样一个框架的关键是对人类行为的看法，即认为完全理性是理性模型家族的一员，而不是模拟人类行为的唯一方式。竞争性机构作为一个支撑结构运行，这样未能学会如何最大化某种外部价值的个体就不再参与竞争博弈。如果所有机构都涉及激烈的竞争，那么用于解释竞争市场行为的薄型理性模型将更有用。基于与我们进化和适应遗产一致的理论的人类行为模型需要加入社会科学和生物科学使用的理论工具的行列。

第三，认知科学家、进化理论家、博弈论者和所有学科的社会科学家已经对使用诸如互惠这样的启发式和行为规范进行了足够的工作。现在有可能继续这一发展，为克服社会困境的集体行动研究奠定更坚实的行为基础。

第四，我们当前的许多公共政策分析，特别是自Garrett Hardin发人深省的文章《The Tragedy of the Common（公地悲剧）》以来，都是基于这样的假设，即理性的个体被困在他们无法从中解脱出来的社会困境中，除非有外部的诱因或制裁。基于这一假设的许多政策已经遭受重大失败，并加剧了它们原本旨在缓解的问题。基于个体可以学习如何制定针对性强的规则并在参与设计影响他们的制度时持续合作这一假设的政策在实践中更为成功。

第五，我们教科书中呈现的公民形象影响着民主政权的长期可行性。假定理性的公民将成为政治生活的被动消费者——大众——并将重点放在国家层面的政客和官员——精英——的角色上的入门教科书，没有向民主政体的未来公民提供他们需要知道并可以采取的行动。虽然许多政治科学家声称摒弃教授民主政体的规范基础，但他们实际上引入了一种犬儒主义和不信任的规范，而没有提供公民如何挑战腐败、寻租或设计不良政策的愿景。

本文剩余部分分为六个部分。第一部分我将简要回顾当前被接受的理性选择理论关于社会困境的理论预测。接下来将总结广泛实验研究对完全依赖理性模型提出的挑战。然后我将考察两个主要的实证发现，它们开始揭示个体如何通过构建互惠、声誉和信任发挥作用的条件，来实现“超越理性”的结果，从而克服短期自我利益的强大诱惑。接下来的部分提出发展第二代理性模型的可能性，接下来的部分构建了一个初步的理论情景。最后，我通过考察将互惠、声誉和信任置于经实证检验的行为主义集体行动理论核心所产生的影响得出结论。

社会困境的理论预测

“社会困境”一词指的是大量个体在相互依赖的情况下独立做出选择的情况。在所有N人社会困境中，一组参与者可以选择贡献（C）或不贡献（~C）以获得共同利益。虽然我在图1中将其表示为非此即彼的选择，但实际上通常是一个关于贡献多少而非是否贡献的选择。

图1：N人社会困境【注：N个玩家在合作（C）与不合作（~C）之间作出选择。当个体选择合作时，他们的收益总是低于那些不合作的个体。预测结果是没有玩家会选择合作，所有玩家都将获得X收益。不合作的诱惑（T）是指任何合作者转为不合作时所能获得的收益增加。如果所有玩家都合作，他们将比所有玩家都不合作时多获得G-X的收益。】

如果每个人都贡献，他们会得到净正收益（G）。每个人都有一个从贡献者组转向不贡献者组的诱惑（T）。理论预测是每个人都会转向不贡献，因此没有人会贡献。如果发生这种情况，结果将处于截距处。预测结果与每个人都贡献之间的差异为G-X。由于价值较低的支付位于纳什均衡，因此在给定其他参与者选择的情况下，没有人有独立动机改变自己的选择。这些情况是困境，因为至少存在一个结果，对所有参与者来说都更有利。因此，存在一个帕累托优势替代方案，但做出孤立选择的理性参与者不会实现这一结果。个体理性和群体理性之间存在冲突。社会困境引发的集体行动问题是如何避免帕累托劣势均衡，接近最优。那些以某种方式协调策略的人会收到“合作者红利”，等于预测结果与实现结果之间的差异。

文献中存在许多社会困境模型。在所有模型中，一组个体参与一场博弈中，导致单次博弈迭代达到纳什均衡的策略产生的结果对所有参与者来说都低于最优结果。因此，均衡是帕累托劣势的。如果参与方通过选择非合作博弈均衡解以外的策略“合作”，则可以实现最优结果。除了关于一次博弈版游戏中支付结构的这些假设外，几乎所有社会困境的正式模型都做出了其他假设。（1）所有参与者对情境的外生固定结构以及在所有策略组合下所有个体将收到的支付具有共同知识。（2）关于策略的决策是独立做出的，通常是同时做出的。（3）在一个对称博弈中，所有参与者都可用相同的策略。（4）没有外部行动者（或中央权威）存在来执行参与者关于其选择的协议。

当这样的博弈被有限次重复时，参与者被假定通过反向归纳来解决博弈。关于特定支付函数的假设有所不同。与其描述本文考虑的所有模型的纳什均衡和帕累托效率结果，不如将与纳什均衡一致的总体行为描述为零合作，而将与效率结果一致的行为描述为100%合作。

这些悲观的预测引发了大量的实证挑战和重要的理论突破。这些预测与如此多的日常经验相悖，以至于一些学者转向调查和实地研究，以考察对公共物品的自愿贡献水平。其他人转向实验实验室，并在一次性实验中确认了远高于预测的合作水平。博弈论者被要求重新思考他们自己坚定的结论，并提出新的模型，说明何时可能出现合作。

在重复博弈中引入两种不确定性——关于重复次数和参与社会困境的玩家类型——导致了更乐观的预测。当被视为完全理性的参与者，具有低贴现率的个体，在其终点由随机确定的重复社会困境中互动时，现在理论上已得到很好的确立，他们有可能实现最优或近似最优结果，避免导致次优结果的一次性和有限次博弈的主导策略。这是可能的，当玩家通过承诺足够惩罚不合作者以阻止不合作，实现了自我实施均衡。Kreps等人引入了第二种不确定性，与是否所有玩家都使用完全理性作为行动指南有关。存在一个“非理性”玩家的概率，他以合作回应合作，被用作完全理性的玩家采用早期合作策略并在博弈序列结束时转向不合作的理由。一旦引入这两种形式的不确定性，可能的均衡数量就会激。一切都得到了预测：最优结果、帕累托劣势的纳什均衡，以及两者之间的所有情况。

为了生成非合作以外的预测，使用标准理性选择理论的理论家发现有必要假设对情况持续时间的实际不确定性，或者假设某些玩家在愿意以合作回应合作方面“非理性”。假设如果一些玩家非理性地选择互惠，那么其他人可以理性地选择互惠，至少可以说，这是对越来越多证据的曲折解释，即互惠是许多个体在社会困境中使用的核心规范。

缺乏整体契合度

在所有社会科学领域，针对各种类型的社会困境，数十年来已进行了大量实验研究。尽管有学者对实验室实验在检验社会科学主流理论预测价值上持质疑态度，但这种方法仍具有诸多优点。首先，研究者能够在控制条件下设计实验来检验同一理论的多个预测。其次，实验可以被复制。第三，研究者能够质疑某一特定设计是否充分捕捉到理论提出的变量，并进一步开展实验，以确定设计变化如何影响结果。下文讨论的证据基于多个不同研究团队的多项研究。第四，实验方法对于研究人类在多种制度安排下的决策行为特别适用。实验研究中的受试者会依据其一生中习得的分析模式和价值观来应对不同的激励结构。因此，实验能精准地检验个体在各类制度环境下是否如理论所预测那样行动。

本节将总结四个被反复验证且直接挑战社会困境实验中观察到的行为与非合作博弈论（基于完全理性与完全信息的一次性和有限重复社会困境）预测之间普遍适应性的发现。我首先关注理论与行为之间的契合度，因为这些理论预测明确无误，且对整个社会科学产生了深远影响。关于市场行为的实验确实与预测高度吻合（详见Davis和Holt 1993年的综述）。若一次性及有限重复社会困境实验能强有力地支持非合作博弈论的预测，则我们将拥有一套与大量得到坚实实证支持的经济学理论紧密关联的基础理论。届时我们需立即转向无限重复情境问题，而这一问题正是非合作博弈论面临均衡过多尴尬局面的所在。然而事实并非如此，我们有一个不同的故事要讲述。这四个一般性发现如下：

大多数类型的社会困境中观察到较高的初始合作水平，但这些水平始终低于最优值。
在有限重复社会困境中，行为与逆向归纳原则不符。
纳什均衡策略在个体层面上并不是良好的预测指标。
个体在重复社会困境中未能学习到纳什均衡策略。

（一）初始合作水平较高但未达到最佳水平

大多数关于具有公共物品供给问题结构的社会困境的实验研究发现，在一次性博弈或重复博弈的初期回合中，合作行为的发生程度显著高于预期的零水平。“在各种各样的实验处理条件下，参与者相当持久地将其代币禀赋的40%至60%贡献给[公共物品]，远超与纳什均衡一致的0%贡献率”。然而，一旦实验重复进行，公共物品实验中的合作水平往往呈下降趋势。不同实验会话间的个体差异可能非常大。尽管许多研究者关注到合作率出乎意料地高，但值得注意的是，在缺乏个体贡献反馈的稀薄制度环境中，合作水平从未达到最优状态。因此，合作率为零的预测可以被否定，但在稀薄制度设置中，次优水平的合作现象却被持续观察到。

（二）社会困境中的行为与逆向归纳不一致

在所有有限次重复实验中，预测玩家会提前考虑最后一个时期，并决定在该时期他们会做什么。在最后一个时期，不存在未来的交互；预测认为他们在那一轮将不会合作。既然这一选择会在实验开始时就确定下来，玩家被认为会回看倒数第二个时期，并问自己在那个时期他们会怎么做。鉴于他们肯定在最后一个时期不会合作，假定他们同样在倒数第二个时期也不会合作。这种逻辑将一直回溯到第一轮。尽管逆向归纳仍然是解决有限次重复博弈的主要方法，但它在理论上受到了挑战。此外，如前所述，关于他人是否遵循纳什均衡建议还是使用类似以牙还牙等规范的不确定性，可能会使玩家在迭代游戏的早期轮次中表现出合作意愿，然后在最后背叛变得合理。从实验证据来看，显然玩家在实验室内做决策时并不使用逆向归纳。Amnon Rapoport从对几项重点关注资源困境的实验的回顾中得出结论：“受试者并未参与或有能力进行逆向归纳。”

（三）纳什均衡策略不能预测社会困境中的个人行为

从上述讨论中可以明显看出，即使在其他情况下纳什均衡策略在个体和群体层面上都是一个好的预测指标，但在社会困境中，个体往往不会使用预测的纳什均衡策略。尽管结果在总体水平上常常接近纳什均衡，但个体行为围绕均值的变异极大。当八名受试者在20至30轮重复的共有资源实验中做出占有决策时，唯一的对称纳什均衡策略从未被采用。在重复的公共物品实验中，个体也没有使用纳什均衡策略。在最近的一组涉及七名玩家进行十轮无沟通或其他任何制度结构决策的十三项实验中，Walker等人在910个受试者可利用的机会中未观察到任何一个个体选择对称纳什均衡策略。Chan等人在研究收入异质性对结果的影响时，也几乎没有发现支持使用纳什均衡的证据：“显然，这里报告的实验室会议的结果不能被描述为纳什均衡结果。”

（四）个体在社会困境中不会学习纳什均衡策略

在无沟通或其他促进制度条件的重复实验中，公共物品（共有资源）实验中的合作水平分别向纳什均衡下降（上升）。一些学者推测，个体只是需要一些时间和经验来学习纳什均衡策略。但这似乎并非如此。在所有重复实验中，随着受试者获得合作水平显著波动且有短暂增加和减少的成果，总体趋势呈现出与纳什均衡一致的聚合。此外，在同一游戏中，不同参与者遵循的策略也有很大差异。

在有限次重复实验中，受试者似乎学到了除纳什策略之外的东西。Isaac, Walker, and Williams比较了当经验丰富的受试者被告知实验将持续10、40或60轮时合作行为衰减的速度。合作行为衰减的速度与决策轮数成反比。受试者似乎不是在学习非合作策略，而是在学习如何在更长的时间内保持适度的合作水平。无论何时出现，只有在最后几个时期，合作率才接近于零。

摆脱社会困境的两种内在方法

这四个频繁复制的、一般性的发现结合起来，对完全理性模型推导出的预测构成了强烈否定。还有两个更为一般的发现也与当前接受的模型预测相悖。同时，它们也开始揭示个体如何能够获得远“优于理性”的结果，至少按照当前接受模型中对理性的定义是如此。第一个是简单的廉价言论为个体提供了互相作出有条件承诺的机会，以及潜在地建立他人将回报信任的能力。第二个是解决改变第一阶困境结构的第二阶社会困境的能力。

（一）沟通与集体行动

在非合作博弈理论中，假设玩家无法达成可执行的协议。10因此，沟通被视为廉价言论。在社会困境中，自利的玩家预计会利用沟通试图说服他人合作并承诺合作行为，但在做出私人决定时选择纳什均衡策略。或者，正如Gary Miller所说：“很明显，简单的沟通不足以摆脱困境。”

从这个理论角度来看，面对面沟通在社会困境中取得的结果应该没有什么不同。然而，一致、有力、可复制的发现表明，当允许个体面对面沟通时，合作水平会大幅提高。这适用于在实验室环境中研究的所有类型的社会困境，以及一次性和有限次重复实验。经济学家、政治科学家、社会学家和社会心理学家进行的超过100项涉及5000多名受试者的实验的元分析中，Sally发现，在一次性实验中提供面对面沟通机会平均会使合作率提高超过45个百分点。当在重复实验中允许受试者在每轮决策前交谈时，他们平均比没有沟通的重复游戏高出40个百分点。没有任何其他变量对结果的影响像面对面沟通那样强烈和一致。即使在不提供每轮群体决策反馈的情况下，沟通对合作水平仍有稳健的积极影响。

沟通的有效性与面对面交谈的能力有关。例如，Sell和Wilson开发了一个公共物品实验，其中受试者可以通过计算机终端发出合作承诺的信号。与使用相同设计的面对面实验相比，合作要少得多。Rocco和Warglien复制了先前共有资源实验的所有方面，包括面对面沟通的有效性。但他们发现，必须依靠计算机化沟通的受试者无法实现与能够面对面沟通的受试者同样程度的效率提高。Palfrey和Rosenthal报告，在提供点公共物品实验中，受试者可以发送计算机化消息，表明他们是否打算贡献，结果没有显著差异。

进行实验研究的人员为沟通为何促进合作提供的原因包括（1）将信息从能够找出最佳策略的人传递给不完全理解什么策略将是最佳的人，（2）交换相互承诺，（3）增加信任从而影响对他人的行为预期，（4）在主观支付结构中添加额外价值，（5）强化先前的规范价值，以及（6）发展群体身份。精心设计的实验表明，沟通效果的主要原因并非第一条。当关于产生最佳联合结果的个体策略的信息清楚地呈现给不能沟通的受试者时，这些信息对取得的结果影响不大。

因此，交换相互承诺、增加信任、创造和强化规范以及发展群体身份似乎是使沟通有效的最重要过程。实验中的受试者确实试图从彼此那里获得对遵循他们认为会导致最佳联合结果的策略的相互承诺。他们经常绕着小组走一圈，让每个人承诺其他人他们会遵循联合策略。讨论环节经常以这样的评论结束：“现在记住每个人，如果我们所有人都遵循X策略，我们都做得更好”。在重复实验中，受试者利用沟通机会对不遵循相互同意策略的未知个人进行口头攻击，使用诸如scumbuckets和finks之类的煽动性术语。Orbell、van de Kragt和Dawes通过强调允许沟通时会引发多少相互强化的过程，总结了十年来对一次性公共物品实验的研究。然而，如果不增加对交换承诺的信任，对他人行为的预期就不会改变。鉴于结果的差异非常大，沟通最有可能影响个人对他人将遵守承诺的信任。正如下面讨论的，信任、有条件承诺和值得信赖声誉之间的关系是有限理性和道德行为第二代理论的关键链接。

然而，随着赌注的增加，难以监控个体贡献时，沟通的效果会降低。E. Ostrom，Gardner和Walker发现，当每个受试者拥有相对较低的禀赋并有机会进行面对面沟通时，他们取得了接近完全最优的结果。当禀赋大幅增加——增加了违反先前协议的诱惑——受试者在沟通实验中比在非沟通实验中取得了更多，但在小赌注情况下却少于小赌注情况。在沟通可行的实地环境中未能实现集体行动指出，仅靠沟通本身并不是在所有条件下确保成功集体行动的充分机制。

（二）创新与集体行动

改变博弈规则或使用稀缺资源惩罚不合作或不履行协议的人通常不被认为是社会困境参与者可行的选择，因为这些行为创造了公共物品。参与者在任何试图使用代价高昂的制裁或改变博弈结构的努力中都面临一个同等或更困难的第二阶社会困境解决第二阶困境的任何尝试的预期结果都是失败。

然而，许多实地环境和实验中的参与者正是这样做的。关于个体如何治理和管理共有资源的广泛研究表明，参与者自己设计和实施的改变底层社会困境结构的规则具有令人难以置信的多样性。参与者采用的具体规则因当地情况和区域内普遍接受和熟知的规则文化库而显著变化。尽管如此，成功自我组织、可持续的本地、区域和国际制度均具有普遍的设计原则。最健壮且持久的共有资源制度通常包含清晰的规则遵守监控机制和渐进式制裁以强制合规。因此，很少有自我组织制度仅依赖于沟通来维持在产生强烈背离互惠承诺诱惑的情况下的合作。作为监控者的参与者自己不会对很少违规的个体施加严厉制裁。适度的制裁向规则破坏者表明他们的不合规行为已被他人注意到。通过支付小额罚款，他们以良好状态重新加入社区，并了解到违规行为会被观察和制裁。反复违反规则者将受到严厉制裁，最终被排除在群体之外。符合这些设计原则的规则强化了条件性承诺，并增强了参与者对他人也在履行承诺的信任。

在实地环境中，规则创新通常在持续的试错过程中发生，直到参与者认为产生实质性净收益的规则系统演化出来。考虑到个体经常面临的物理世界的复杂性，他们几乎不可能在第一次或第二次尝试中“正确制定规则”。在高度不可预测的环境中，个体需要经过长时间的试错才能找到在足够长的时间范围内产生实质性正净收益的规则。在存在定期处理冲突案件的场所，有时创新新规则以更有效地应对冲突的情况下，成功的制度中非暴力冲突可能是一个常规特征。

除了对参与者所面对情境结构变化的广泛实地研究外，大量实验中的受试者也解决了第二阶社会困境，从而使其第一阶困境的结果更接近最优水平。例如，Toshio Yamagishi对完成了一份包括衡量信任度量表项目问卷的受试者进行了实验。在信任度量表上排名较高的受试者对集体物品的贡献始终比排名较低的受试者多约20%。然而，当有机会为用于对为共同结果贡献最少的个体处以罚款的“惩罚基金”捐款时，信任度低的个体对惩罚基金的捐款显著更多，并且实现了最高的合作水平。在这个实验的最后一轮中，他们将90%的资源投入到了联合基金中。这些结果现已在北美受试者中得到复制，表明最初最不信任的个体愿意为制裁体系捐款，并且对博弈结构变化的反应比最初更信任的个体更强。

E. Ostrom, Walker, and Gardner还考察了受试者愿意支付“费用”以便“罚款”另一个受试者的意愿。与预期的零制裁使用相反，个体支付费用对他人处以罚款的水平明显高于零。当制裁与一次沟通机会或讨论并投票创建自己的制裁体系的机会相结合时，结果显著改善。仅有一次沟通机会，受试者能够实现平均85%的最优投资水平（扣除制裁成本后为67%）。那些面对面会面并以多数票同意自己制裁体系的受试者实现了93%的最优产出。背叛水平仅为4%，因此制裁体系的成本较低，净收益达到90%水平。

Messick及其同事开展了一系列旨在考察受试者在面临共有资源困境时集体行动改变制度结构意愿的实验。特别是，他们反复给予受试者放弃从共有资源中提取的个人决策权，将其交给有权为整个群体做决定的领导者的机会。他们发现，“当人们看到公共资源正在枯竭时，他们想要改变规则并带来结构性变革”。然而，仅仅有不平等的分配结果并不足以影响改变制度结构的决定。

这些实验告诉我们什么？它们补充了来自实地环境的证据，表明暂时陷入社会困境结构中的个体可能会投资资源进行创新和改变结构本身，以改善共同结果。它们还加强了先前的证据，即依赖于特定个体模型的当前被接受的非合作博弈理论并不能充分预测一次性或有限重复社会困境中的行为。合作博弈理论并未提供更好的解释。由于合作博弈理论和非合作博弈理论都预测极端值，两者都无法解释倾向于增强或减少合作水平的条件。

社会科学中真正的大难题是发展一种一致的理论来解释为什么合作水平差异如此之大，以及为什么特定的情境条件配置会增加或减少第一阶或第二阶困境中的合作。这个问题不仅对我们的科学理解很重要，而且对设计旨在促进个体在社会困境中实现更高生产成果水平的制度也很重要。许多结构性变量影响所选择的具体创新以及这些制度变革的可持续性和分配后果。然而，如果没有一种预测不会发生创新的个体选择理论，我们无法触及一种关于制度变革的连贯理论。我们需要一种关于有限理性、创新和规范行为的第二代理论。

走向第二代理性模型

第一代理性选择模型在强竞争淘汰不积极最大化眼前外部价值的玩家时，是强大的预测引擎。虽然错误地与一般人类行为理论混淆，但完全理性模型将继续被包括作者在内的社会科学家有效利用。但是，正如Selten指出的那样，需要将薄型理性模型视为有限或不完全理性的极限情况。所有理性选择模型都与一种关于人类行为的一般理论相一致，该理论视所有人类为复杂、易犯错误的学习者，他们在面对的约束条件下力求做到最好，并且能够启发式学习、规范、规则以及如何制定规则以改善所取得的结果。

（一）启发式学习、规范和规则

由于个体是有限理性的，他们不会为面临的每个情境计算出一套完整的策略。生活中很少有情境能提供关于一个人可以采取的所有潜在行动、可以获得的所有结果以及其他人可以采取的所有策略的信息。在完全理性模型中，人们简单地假设这种信息水平。在实地情境中，个体倾向于使用他们在一段时间内学到的关于在特定类型情境中往往带来良好结果的响应的启发式规则（经验法则）。他们在参与实验室实验时也会带着这些启发式规则。在频繁遇到的重复情境中，个体学会越来越好的、针对特定情境定制的启发式规则。随着重复、足够高的利害关系和强烈的竞争，个体可能会学到接近最佳响应策略的启发式规则。

除了学习工具性启发式规则外，个体还会学习采纳和使用规范和规则。我所说的规范是指个体对采取特定类型行动赋予内部价值判断——正面或负面——它被添加到或从行动的客观成本中减去。Crawford和Ostrom将这种内部估值称为delta参数。Andreoni模型中的个体在短期内帮助他人超过帮助自己时，会获得“温暖感觉”。Knack将负面内部估值称为“责任”。许多规范是从与不同社区成员互动中学到的，关于特定类型情境中预期的行为。偏好变化代表了从生活中（或从长辈和同龄人提供的训练中）内化了特定道德教训。个体对未来采取特定类型行动（如说真话、守承诺）的承诺强度反映在其delta参数的大小上。在经历他人合作行动的反复益处后，个体可能会决意在未来总是发起合作行动。或者，在多次成为此类经验中的“冤大头”之后，个体可能会决意永远不做第一个合作的人。

由于规范是在社会环境中习得的，它们在文化间、同一文化内的个体间、个体面对不同类型情境时以及任何特定情境随时间推移中都有很大差异。假设个体获得规范的行为含义与假设个体学会使用启发式规则的行为含义并无实质区别。我们可以将规范视为个体从道德视角采纳的启发式规则，即它们是其希望在生活中遵循的行动类型。一旦某些个体习得了行为规范，它们就会影响他人的期待。

我所说的规则是指一组个体已形成共享理解，即在特定情境中某些行动必须、禁止或可以采取，且会对不遵从者施加制裁。在田野工作中，要区分广泛共享的适用于广泛类型情境的内化规范与针对特定情境有意识采用的规则有时很困难。理论上，可以认为个体在学习适用于广泛多样特定情境的普遍行为规范。规则是与特定情境中特定行动相关的产物。规则既可在私人协会中创建，也可在更具形式化的公共机构中创建，在那里它们还带有作为执行法律条文的额外法律分量。规则可以通过明确和公开互惠承诺来增强互惠。反之，规则也可以赋予行动权力，使利益和成本分配不公，从而破坏对正面规范的依赖。

（二）互惠：一类特别重要的规范

人类迅速学习并有效运用启发式、规范和规则的现象与从进化心理学、演化博弈论、生物学以及有限理性中得到的教诲是一致的。人类似乎已经演化出了用于处理各种任务的专门认知模块，包括理解所见事物、通过接触某种语言的成人说话者推断语法规则，以及在社会困境中提高长期交互收益。在口头承诺能够被外部权威强制执行之前，人类就已经面临并解决了与抚育和保护后代、获取食物以及信任他人履行未来承诺行动相关的社会困境。大量证据表明，人类继承了一种强烈的能力，能够学习增强应对众多社会困境中获益机会的互惠规范和社会规则。

互惠是指在涉及（1）努力识别其他参与者、（2）评估他人作为条件合作者的可能性、（3）如果信任他人是条件合作者则决定最初与其合作、（4）拒绝与不互惠的人合作、（5）惩罚背叛信任的人的社会困境中可使用的策略集合。所有互惠规范共有的要素是，个人倾向于以积极回应回应他人的积极行动，以消极回应回应他人的消极行动。互惠是所有社会中都会教授的基本规范。

迄今为止最为著名的互惠策略——以牙还牙——已经从进化的角度得到了大量的研究。在模拟中，从人群中抽取配对的个体，然后让他们在囚徒困境游戏中反复互动。每个人被建模为好像遗传了一个包含固定准则的策略，这些准则是始终合作、始终背叛，或者是以牙还牙的互惠策略（先合作，然后在下一轮做对方上一轮做的事情）。Axelrod和Hamilton以及Axelrod已经证明，当个体被分组使得他们更可能相互而非与总体人口互动，且预期的重复次数足够大时，以牙还牙等互惠策略能够成功侵入由遵循全背叛策略的个体组成的群体。互惠策略要在参与者可能犯错的情况下存活下来，发生交互的群体规模可能需要相对较小。

提出有助于个体获得更大合作者红利的互惠规范依赖于参与者某种程度上愿意使用报复。例如，在以牙还牙中，个人必须愿意通过在当前回合背叛来“惩罚”上一回合背叛的玩家。在冷酷触发策略中，个人必须愿意最初合作，但如果在当前回合发现任何背叛，则“惩罚”所有人直到游戏结束。

人类并非通过生物过程继承特定的互惠规范。这一观点更为微妙。个体继承了对学习那些在与同样学习并珍视类似规范的他人共同面对社会困境时能增加自身长期利益的规范的高度敏感性。在任何文化的成长过程中，父母、兄弟姐妹、朋友和教师提供了成千上万的事件（学习试验），其中包含了该文化中盛行的相互期望的具体内容。正如Mueller指出的，人类遭遇的第一个困境是作为孩子时。父母通过奖惩直到合作成为一种习得反应。在当代背景下，企业经理人通过不断重申和奖励企业员工使用关键原则或规范来追求一个值得信赖的企业声誉。

由于特定的互惠规范是学来的，不是每个人都能够在所有情况下学会使用相同的规范。一些人学会了并不那么“友善”的行为规范。聪明且不择手段的个体可能会学会如何诱使他人陷入困境，然后背叛他们。通过这种方式可以获得大量资源，但必须隐藏意图和行为，保持移动，或获得对他人的权力。在一个仅由遵循互惠规范的个体组成的群体中，检测和惩罚作弊者的技能可能会丧失。如果发生这种情况，就会受到能够利用该状况的聪明外部人士或本地异端的入侵和初期重大损失。过于信任可能是危险的。一些不可信赖参与者的存在磨练了遵循互惠规范者的技能。

个体在特定情境中是否使用特定规范、结构变量如何影响他们对信任和在特定情境中相互合作的意愿，以及他们如何建立自己的声誉。有些个体只在存在严密监督和可能严厉报复的情况下才使用互惠。另一些人只有在公开承诺达成协议并从他人那里获得信任会得到回报的保证时才会在困境中合作。还有些人发现通过建立自己始终信任他人直至被证明错误的个人身份来构建外部声誉更容易。如果这种信任被证明是错位的，他们就会停止合作，要么退出情境，要么进入惩罚阶段。正如Hoffman, McCabe, and Smith：“实验室中的一次性游戏是人生序列的一部分，而不是要求行为偏离自身声誉规范的孤立经历。因此，我们应该期望受试者在实验设置中依赖互惠规范，除非他们在参与某个特定实验的过程中发现互惠受到惩罚而其他行为受到奖励。在这种情况下，他们会放弃直觉，尝试更好地服务于自身利益的其他策略。”

在任何个体群体中，当面对重复社会困境时，人们可能会发现有些人使用三种互惠规范之一：

先始终合作；若他人不互惠则停止合作；如果可行则惩罚不合作者。
只有在判断他人值得信任时才立即合作；若他人不互惠则停止合作；如果可行则惩罚不合作者。
一旦他人建立了合作，自己也合作；若他人不互惠则停止合作；如果可行则惩罚不合作者。此外，还可能发现至少三种其他规范。
从不合作。
模仿（1）或（2），但若能成功搭便车则停止合作。
始终合作（在所有文化中都非常罕见的规范）。

遵循每种类型的规范的个体比例会在一个亚群体到另一个亚群体以及一个情境到另一个情境之间变化。互惠是否对个体有利取决于使用互惠的其他个体的比例，以及个体判断任何特定情境和随时间推移中互惠者可能出现频率的能力。当有许多人使用总是先合作形式的互惠时，即使在一次性情境中，合作也可能在综合评估多种情境时带来更高的回报。有限理性的个体预期其他有限理性的个体遵循各种启发式、规范和策略，而不是期望找到采用单一策略的其他人——除非在那些制度选择过程筛选出不寻求最优策略者的重复情境中。投资于检测其他个体的意图和行动可以改善自身的结果。为了使使用互惠变得合理，不必假定他人是“非理性”的。

（三）在实验环境中使用互惠的证据

实验室实验提供了证据，表明即使在实验非常短期的环境中，也有相当一部分个体使用互惠规范。一些证据来自关于最后通牒博弈的实验。在这些游戏中，两名玩家被要求分配一笔固定的金额。第一玩家向第二玩家提出分账建议，后者决定接受或拒绝该提议。如果提议被接受，则按提议的方式分配资金；如果被拒绝，则双方都得零分。理论预测的均衡状态是，第一玩家将向第二玩家提议最小单位的金额，而第二玩家将接受任何大于零的提议。这一预测自Guth, Schmittberger和 Schwarze的工作以来已被反复证伪。被分配到第一位的受试者倾向于提出远超过最小单位的金额。他们经常提出将总额平均分割的“公平”分配方案。第二位玩家则倾向于拒绝较小的提议。不同文化背景下，对于提议的接受水平往往围绕不同的值聚集。鉴于拒绝接受提供的资金与完全理性模型的基本原则相悖，这些发现对该模型在此场景下的经验有效性构成了重大挑战。

为解释这些发现，提出了多个假设，包括“惩罚假设”和“学习假设”。惩罚假设本质上是一种互惠论点。与适应性学习相反，它认为第二位玩家拒绝不平等分配的原因在于要惩罚第一位玩家的不公平对待，赋予其动机。这种负向互惠的倾向是论点的关键。考虑到这一点，第一位玩家出于害怕一无所获的恐惧，应该倾向于避免提出完美的均衡提议。

Abbink及其同事设计了一项实验，在其中，学习假设和惩罚假设的预测明显不同，并且他们发现了对惩罚假设的强烈支持。“我们发现，当这样做会惩罚第一位玩家时，第二位玩家拒绝不平等分配的可能性是……奖励第一位玩家时的三倍”。因此，第二位玩家确实似乎会惩罚提出不公平分配的第一位玩家。

从一次性社会困境中得出的另外两个发现进一步证实了受试者的行为倾向。首先，那些打算在特定一次性社会困境中合作的人，比打算背叛的人更强烈地期待他人给予合作回报。Orbell和Dawes总结自己的工作时说：“在这些研究中，我们最一致的发现之一——被其他人的工作所复制的发现——是合作者期待的合作显著多于背叛者。”其次，当面临是否参与社会困境的选择时，打算合作的人表现出更大的意愿进入此类交易。鉴于这两种倾向，互惠者更可能对找到遵循相同规范的他人持乐观态度，从而相比于非互惠者，他们更有可能参与更多的自愿性社会困境。同时，相当一部分人口也愿意付出代价来惩罚不合作者（或提出不公平提议的人）。

规范来源于先前的经验（社会化），并受到导致实验设计间系统差异的情境变量的影响。通过以下方式可以提高信任水平和由此产生的合作水平：（1）给予受试者观察彼此的机会；（2）允许受试者选择是否进入或退出社会困境游戏；（3）如果一个最小集合自愿为公共物品做出贡献，则平均分担成本；（4）提供对不合作者进行明确惩罚的机会；以及如前所述的（5）提供面对面沟通的机会。

（四）核心关系：互惠、声誉和信任

当许多个体采用互惠行为时，就存在一种激励去获取信守承诺和实施短期内有成本但长期净收益行动的声誉。因此，可信赖的个体若信任那些同样具有可信声誉（并试图避开那些被认为不可信赖的个体）的他人，就可以在即使是困境的情况下，只要他们主要与那些有信守承诺声誉的人进行互动，就能开展互惠互利的社会交换。拥有可信或者对那些不履行协议或不尽自己公平份额者采取报复行为的声誉，成为一项宝贵的资产。在进化背景下，当他人使用互惠规范时，这种声誉会提高个体在该环境中的适应度。相似地，在他人可信的环境中培养信任也是一种优势（。信任是当一个人在未知他人行为的情况下必须作出行动时，对他人行为的预期对其选择的影响。在社会困境的语境中，信任影响个体是否愿意发起合作，期望得到对方的回报。有限理性的个体在进入情境时，基于自身的先前训练和经验，会对使用互惠有一个初始概率。

因此，行为解释的核心在于个人对他人的信任、他人对可信声誉的投资以及参与者使用互惠规范的概率之间的联系（参见图2）。这个相互强化的核心不仅受到结构变量的影响，还受到参与者过去经历的影响。在重复困境的最初一轮中，个体是否发起合作行为，取决于他们自身的规范、他们对他人是否为互惠者的信任程度（基于他们能收集到的关于彼此的任何信息），以及结构变量如何影响他们自身及他人行为的预期。

图2：核心关系

如果初始合作水平适中较高，那么个体可能会学会相互信任，更多人可能会采纳互惠规范。当更多个体使用互惠规范时，获得可信声誉就成为一个更好的投资。因此，信任、互惠和可信声誉的水平形成了正向强化。这也意味着这三者中任何一个的下降都可能导致恶性循环。这种方法不是直接解释合作水平，而是引导我们将结构变量与信任、互惠和声誉的内在三角联系起来，因为这些因素反过来又影响合作水平和净收益。

（五）沟通和核心关系

有了这些核心关系，我们可以开始解释为什么重复的面对面沟通会极大地改变情境的结构。通过与他人反复见面和交谈的机会，参与者可以评估是否足够信任他人，以尝试就联合努力水平及其分配达成简单的有条件协议。在有条件协议中，个体同意为共同努力贡献X资源，前提是至少有Y个他人也做出贡献。有条件协议不需要包括所有受益者。Y比例受影响者贡献所带来的收益可能如此之大，以至于一些人愿意在Y比例他人也同意并履行的情况下贡献。

沟通使个体能够提高（或降低）对他人可靠性的信任。当成功时，个体将他们的预期从他人使用互惠规范的初始概率转变为他人将回报信任和合作的更高概率。当个体在资产和收益上对称时，最简单的协议是平等地分享接近最佳联合结果的贡献水平。当个体不对称时，达成协议更困难，但可以使用各种公平规范来减少达成协议所需的时间和精力。

有条件协议可能涉及对不合作者的惩罚。在N人设置中，如何惩罚不合作玩家、维护自己的声誉以及维持任何已发生的初始合作，比两人设置更困难。在N人、不确定的情境中，从低于预期的结果中判断是某人严重作弊、多人轻微作弊、有人犯错还是所有人都合作且外生随机变量降低了预期结果，是困难的。如果没有沟通，问题会变得更糟。没有沟通和对共享公式的约定，个体可以通过他们的行动尝试表示合作意愿，但没有人同意任何特定的贡献。因此，无论是外部还是内部，都没有任何人的声誉处于风险之中。

一旦在N人设置中达成了口头协议，它就成了特定正在进行的小组内进一步行动的焦点。如果每个人都遵守协议，那么对于互惠者来说，就不需要进一步的反应。然而，如果协议没有得到遵守，那么遵循互惠规范的个体——在没有关于对不合规行为进行选择性制裁的先前约定的情况下——需要惩罚那些没有遵守承诺的人。经常提出的惩罚是冷酷触发策略，即参与者在发现任何作弊行为后永远按照纳什均衡策略行动。在重复实验中，受试者经常讨论使用冷酷触发策略来惩罚轻微的背离行为，但拒绝这个想法，因为它会惩罚所有人，而不仅仅是作弊者。一种不那么激烈的惩罚策略是适度反应。在适度反应中，参与者对协议的小偏离（如果有）作出温和（甚至没有）的反应。背离触发温和反应，而非严厉惩罚。如果背离持续一段时间，适度反应会逐渐从协议点向纳什均衡移动。

出于几个原因，这在具有最小制度结构和没有关于个人贡献反馈的N人设置中的初始“惩罚”阶段是有意义的。如果只有小偏离发生，那么大多数参与者的合作已经在产生正回报。通过将自己的反应保持在协议附近，一个人保持了自己的合作声誉，保持了较高的合作水平，并使恢复完全符合变得更容易。立即使用类似冷酷触发的东西会导致协议的瓦解，随着时间的推移失去大量收益。为了补充适度反应，人们会花费精力确定谁违反了协议，使用口头责备试图让那个人重新回到正轨，以及避免与那个人的未来互动。

因此，理解信任、互惠和声誉如何相互作用（或它们的缺乏，这会产生一系列负面效应），有助于解释为什么重复的面对面沟通会有如此大的影响。达成初步协议并相互做出个人承诺，会危及个体作为言出必行者的自我认同，增加信任，并使互惠成为更有利的策略。在小团体中，言语训斥可以部分替代金钱损失，当辅以适度反应时，可以使许多团体保持高水平的合作。只见面一次可以大大增加信任，但如果一些人没有立即合作，团队就没有进一步的机会解决这些问题。任何合作水平较低的证据都会削弱首次会议中建立的信任，也没有进一步的机会建立信任或使用言语制裁。现在也更清楚为什么发送匿名、计算机化的信息不如面对面沟通有效。个体通过观察面部表情和听别人说话的方式来判断他人的可信度。在一群独立、私下决策且看不见、不交谈的陌生人中建立信任是很困难的。

示例性理论场景

我已经试图展示发展第二代理性模型的必要性，以便开始对我们在社会困境实证研究中所知内容进行连贯的综合。我没有尝试开发新的形式模型，而是在理论层面上识别了应在未来形式模型中包含的人类行为属性。在解释社会困境中的行为时，尤其重要的个体属性包括个体对他人行为的预期（信任）、个体从社会化和生活经验中学到的规范（互惠）以及个体创造的反映其意图和规范的身份（声誉）。信任、互惠和声誉可以被纳入个体行为的形式模型中。

在本节中，我构建了理论情景，说明外生变量如何结合影响与图2所示核心关系集相连的内生结构变量。考虑到重要变量的数量以及许多变量的效果依赖于其他变量的值，不可能在一个大型因果模型中关联所有结构变量。然而，可以生成连贯的、累积的理论情景，这些情景从相对简单的基准模型开始。然后可以开始系统地探索当一个变量发生变化时会发生什么。让我用理论情景来说明我的意思。

让我们从一个有利于合作的情景开始——一个由十名农场主组成的小团体，他们的农场规模大致相同。他们共享一条流经他们相对平坦土地的溪流用于灌溉。每年他们都面临组织一次集体劳动日来清理前一年冬天倒下的树木和灌木的问题。所有十人都期望在未来无限期地继续务农。假设溪流提供的水供应量直接与完成的劳动天数成正比。所有农场主都有生产力机会，他们的劳动边际回报比他们自己在这项努力中的投入回报高。因此，搭便车并希望其他人提供劳动力在客观上很有吸引力。然而，对每个农场主来说，参与成功清理溪流的集体努力的价值高于参与的成本。

现在让我们考察一些结构变量如何影响集体行动的可能性（见图3）。作为一个小团体，他们很容易进行面对面的沟通。由于他们的利益和资源相对对称，达成关于如何分配工作的公平、有条件协议应该不太困难。一个简单易监控的协议是他们都同一天工作，但每个人负责清理流经其地产的那一段溪流。遵守这样的协议很容易验证。在讨论过程中，他们可以强调每个人参与劳动日的重要性。在面对面的会议上，他们还可以谈论过去未参与的人，敦促他们改变做法，并威胁说如果不“改过自新”，就停止所有劳动力贡献。考虑到小组规模小、对称性高、提供公共物品的成本相对低，再加上相对较长的时间期限，我们可以有把握地预测，面临这种情况的大部分个体将找到合作方式，克服这一社会困境。不仅实证研究的证据支持这一预测，而且大量实地证据也与这一解释一致。

图3：一个简单的场景

这是一个粗糙但连贯的因果理论，它使用结构变量（小组规模小、资产和资源对称、时间期限长、生产函数成本低）来以高概率预测参与者自己可以解决这个社会困境。对这个相对容易情景的任何结构变量的变化都会影响这一预测。即使是微小的变化也可能足以逆转预测结果。例如，假设另一个当地农民购买了五块土地，计划长期耕种。现在只有六名农民，但其中一名拥有相关资产的一半。如果这名农民持有公平分配集体利益工作量的规范，即分配工作量与分配利益的比例相同，那么增加的异质性不会是一个难以克服的问题。他们将同意——就像世界各地的农民经常同意的那样——按照他们拥有的土地面积比例分配工作。如果这位新农民使用不同的公平概念，那么这个小团体可能面临的挑战比大团体更大，因为它的异质性增加了。

现在，假设这五块土地被当地开发商购买，用作未来的郊区住宅开发。对于灌溉投资而言，六名参与者之一——开发商——的时间期限极短。在开发商看来，他不是一个“搭便车者”，因为他看不到清理溪流的好处。因此，这样一个变化实际上产生了几个变化：小组规模N的减少、利益和资源不对称性的引入，以及一个参与者拥有半数资源，但时间期限短，对联合利益不感兴趣。这说明一个结构变量的变化如何引发其他结构变量的连锁变化，以及如何难以对一个变量对合作水平的影响提出简单的双变量假设。特别是，这个小团体比十个对称农场主组成的较大团体合作的可能性要小得多，这与对群体规模效应的标准看法正好相反。

意义

发展基于实证、有限理性和道德决策的第二代模型具有重大意义。现在可以更系统地探讨令人困惑的研究问题。新的研究问题将被打开。我们需要扩大政治学中常规使用的研究方法类型。我们需要提高形式理论、实验研究和实地研究领域中从事社会和生物科学工作的人员之间的理解水平。政策分析的基础需要重新思考。公民教育可以基于经实证验证的集体行动理论，赋予公民运用“结社的科学与艺术”的能力，以帮助在21世纪维持民主政体。

（一）对研究的意义

关于社会困境的研究表明了一个充满可能性而非必然性世界。我们既没有陷入无法避免的悲剧，也没有摆脱创造和维护有助于实现互利成果的激励措施的道德责任。我们不能采纳早期群体理论家那种认为只要获得共同利益，群体总会形成的沾沾自喜的假设。我们预料到许多群体由于相互之间缺乏信任，或者缺乏低成本沟通、制度创新和创建监督与惩罚规则的场所，将无法实现互利效益。我们也不能仅仅安心地认为只有一种机构适用于所有社会困境，比如竞争市场，在其中追求个人偏好的个体被引导产生互利结果。虽然新机构常常促进集体行动，关键问题在于设计新规则、激发参与者在规则制定后遵守规则，以及发现并适当惩罚作弊者。如果没有个体视规则为增强互惠关系的适当机制，地球上没有任何警察力量和法院系统能够单靠自身监控和执行所有所需规则。大多数人也不会愿意生活在警察真正成为强制执行所有规则的薄蓝线的社会。

尽管我正在提议进一步发展第二代理性选择理论，基于完全但狭隘理性的理论将继续在我们理解人类行为中发挥重要作用。源自完全理性选择理论的清晰无误的预测将继续作为进行实证研究和衡量任何其他对观察到的行为解释的成功或失败的关键基准。一个关键研究问题将继续是：完全理性理论的预测均衡与观察到的行为之间有何差异？此外，博弈论学者已经在探索如何在博弈论模型中纳入声誉、互惠和各种行为规范。因此，有限理性和完全理性模型在接下来的十年可能会变得比今天看起来更加互补。

对于关注多种制度安排的政治科学家来说，完全理性选择理论提供了分析制度对才智出众、分析精细、短期享乐主义者策略的脆弱性的成熟方法。任何严肃的制度分析都应包括了解制度——包括立法程序的组织方式、计算选举权重和最小获胜联盟的公式、全球环境问题的国际协议——如何易受精于算计、不道德参与者操纵的努力。除了在任何人群中学习了互惠规范的个体外，还存在其他试图颠覆这一过程以获取对自己非常丰厚回报而无视他人利益的个体。人们应该始终知道让这类个体在任何特定制度环境下运作的后果。

需要利用第二代人类行为模型立即解决的研究问题涉及结构性变量对成功组织集体行动模式可能性的影响。鉴于结构性变量数量众多且许多变量的效果依赖于其他变量的值，将所有结构性变量关联在一个大型因果理论中是不可能的。然而，可能的是开发连贯的、累积的理论情景，这些情景从相对简单的基线模型开始，然后每次改变一个变量，如上所述简要演示。从这些情景出发，可以转向形式模型并在田野和实验室环境中进行实证检验。这种从此类企业中产生的理论不会导致许多学者向往的那种全局二元（或甚至多元）预测。Marwell和Oliver为涉及大量异质参与者集体行动的社会困境构建了这样一系列理论情景。他们对理论和实证企业的性质得出了类似的结论：“这并不是说使用我们的视角不可能做出一般理论预测，只是它们不能是简单的和全局的。相反，我们能够有效生成的预测必须是复杂的、交互的和条件的”。

作为政治科学家，我们需要认识到政治体系是复杂组织的，我们很少能断言一个变量总是与因变量正相关或负相关。可以做比较静态分析，但必须知道其他变量的值，而不仅仅是假设它们围绕平均值变动。

发展有限理性和道德行为的第二代模型将开启一系列对所有社会科学家和许多对人类行为感兴趣的生物学家具有重大意义的新问题。这些问题包括：个体如何对他人心生信任？信任如何受到不同制度安排的影响？在评估他人行为时使用了哪些口头和视觉线索？个体如何获得共同理解，以便制定和遵循自我组织的安排？John Orbell提出了系列引人入胜的问题：“为什么人们首先会参与到这些游戏中来？我们在这些游戏中如何选择伙伴？我们在选择个体伙伴的策略与添加或移除个体出组的策略上有什么不同？”

一组重要问题与制度如何增强或限制相互信任、互惠和声誉的建立有关。近期关于税收遵从性的一系列研究提出了关于公民使用的信任启发式及其对政府监测遵从性努力反应的重要问题。过多的监测可能会产生反直觉的结果，即个人感到自己不被信任，从而变得不那么值得信赖。Bruno Frey质疑一些正式制度安排（如社会保险和付费让人们贡献努力）是否降低了个体继续对其主要出于内部规范而采取行动赋予积极内在价值的可能性。相反，他们可能认为正式组织负责照顾共同需求，互惠不再必要。

由于所有规则都为制裁不合规者提供了合法性，规则可以被用来主要将利益分配给主导联盟。因此被排除在外的人除了为了避免制裁外，没有合作的动力。使用第一代模型，无论如何这是预期的结果。使用第二代模型，人们关注宪法和集体选择规则如何影响利益分配和互惠合作的可能性。虽然已经对长期成功的自组织机构进行了大量研究，但对于从未真正起步或在多年成功后失败的机构的记录却较少。需要付出更多努力来找到关于这些失败尝试及其失败原因的可靠档案信息。

我如此广泛依赖实验研究可能会让人惊讶。我这样做有几个原因。随着理论成为我们学科越来越重要的核心，实验研究将成为政治科学家基本实证研究方法的行列。作为一名过去35年来热衷于实地研究的学者，我深知在实地环境中检验理论的重要性与困难——特别是在变量互动发挥作用时。大规模实地研究将继续是实证数据的重要来源，但它们往往是探究制度激励如何结合影响个体行为和结果的昂贵且效率低下的方法。当我们检验关于一个连贯框架内不同模型或理论中争议要素的假设时，实验方法往往比在实地寻找变量精确组合更能有效地梳理竞争假设。通过将实验方法加入到已广泛使用的实地方法库中，21世纪的政治科学将在获得坚实的人类行为理论及多样制度安排对行为影响的理论方面取得更快、更一致的进步。实验室研究仍需辅以扎实的实地研究以满足外部效度标准。

（二）对政策的意义

采用一种更为宽泛的理性理论可能导致对国家的不同看法。如果认为个体无助，那么国家就是必须为所有人解决社会困境的必要外部权威。然而，如果假定个体能够依靠启发式和规范来解决某些问题，并创造新的结构安排来解决其他问题，那么对国家政府可能做什么的形象就会有所不同。大型政府，包括国防、货币政策、外交政策、全球贸易政策、适度的再分配、当某些群体组织起来剥削他人时维护内部和平、提供准确信息以及处理具有全国性影响冲突的场所，以及其他大规模活动，都有非常重要的作用。但是，国家政府对于治理全球公域而言太小，而对于处理较小规模的问题又太大。

要实现一个复杂、多层次的治理体系相当困难。这引发了许多类型的问题。不同类型的制度如何在等级制内部以及面临集体行动问题的群体成员之间支持或破坏互惠规范？实地研究表明，所有稳健的共有资源制度几乎普遍采用监控和渐进式制裁。这告诉我们，如果没有外部对这类制度的支持，仅靠互惠很可能无法完全解决更具挑战性的共有资源问题。需要注意的是，制裁是渐进而非最初就严厉的。基于严格期望值理论的现行犯罪理论并不能解释这一点。如果人们能学会将互惠作为组织生活的根本规范，并且同意一套依赖于他人遵守这些规范的规则，那么渐进式制裁所做的不仅仅是威慑违规行为。

互惠规范也有其阴暗面。如果惩罚表现为报复升级，那么克服社会困境的群体可能仅限于紧密的亲朋圈子，他们只与彼此合作，与外部人保持着敌对关系的矩阵。这种模式可能导致世仇、袭击和公开战争。或者，那些彼此高度信任的个体圈子可能会歧视那些肤色、宗教或种族不同的人。注重礼尚往来也可能是腐败的根源。一些社会困境未得到解决，符合每个人的利益，比如垄断和卡特尔的形成，违反基本道德规范和法律关系，以及限制开放社会和不断扩张的经济的机会。为那些陷入功能失调网络的人提供替代机会的政策，与刺激和鼓励积极网络的政策同样重要。

（三）对公民教育的意义

人类历史告诉我们，专制政府经常对自己的公民和其他司法管辖区的公民发动战争。民主的特点是不诉诸大规模杀戮而处理个人和群体之间的冲突。然而，民主本身也是脆弱的机构，如果公民和官员不保持警惕，它们就容易受到操纵。对于那些希望21世纪成为和平世纪的人来说，我们需要将我们对集体行动的研究成果转化为适合高中生和本科生的材料。我们太多的教科书只专注于领导者，更糟糕的是，只关注国家级领导者。学生完成关于美国政府或更广泛的政治学的入门课程后，不会了解到他们在维持民主方面发挥着至关重要的作用。公民参与被描述为联系领导者、组织利益集团和政党以及投票。公民需要额外的技能和知识来解决他们面临的社会困境，这一点却无人问津。他们的道德决策也没有被讨论。我们正在培养出一代又一代相互之间缺乏信任的愤世嫉俗的公民，更不用说他们对政府的信任了。鉴于信任在解决社会困境中的核心作用，我们可能正在制造破坏我们自身民主生活方式的条件。正是普通人和公民在塑造和维持日常生活机构的可操作性。我们有责任将关于个人如何解决他们所面临的大小不一的多种社会困境的最佳知识传承给下一代。

(因篇幅限制，参考文献从略）

〇编辑、排版：焦磊

〇审校：郭瑞涵大兰

继续滑动看下一个

比较中的政治研究

向上滑动看下一个

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

人民日报征集“中美友好合作故事”，令人感奋

刘恺威近况曝光，父亲刘丹证实已分手，目前失业在家，没有资源

紧急通告！三高的“克星”终于被找到了！！不是吃素和控糖,而是多喝它....

话费充值活动来了：95元充值100元电话费！

为什么理性选择研究范式经久不衰？| 名家讲座013：Elinor Ostrom

您可能也对以下帖子感兴趣

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

人民日报征集“中美友好合作故事”，令人感奋

刘恺威近况曝光，父亲刘丹证实已分手，目前失业在家，没有资源

紧急通告！三高的“克星”终于被找到了！！不是吃素和控糖,而是多喝它....

话费充值活动来了：95元充值100元电话费！

生成图片，分享到微信朋友圈

为什么理性选择研究范式经久不衰？| 名家讲座013：Elinor Ostrom

您可能也对以下帖子感兴趣