跳到主内容
✍️ 公众号文章
研究者

信念的博弈:Martin Dufwenberg 的心理博弈论世界

介绍 Martin Dufwenberg 三十年构建心理博弈论的工作:效用依赖信念层级,统一解释承诺、内疚、互惠、欺骗、税收、疫情和后悔等现象,并提炼其先直觉后形式化、基准再扩展的学术风格与对年轻学者的启示。

李学恒20 分钟阅读#psychological-game-theory#belief-dependent-utility#guilt-aversion#reciprocity#martin-dufwenberg

从一个承诺说起

想象一个简单的信任博弈。A 手里有一笔钱,可以交给 B 投资。如果 A 信任 B,钱会翻倍,B 可以选择分一半给 A,也可以全部吞掉。标准博弈论的预测很明确:一次性博弈中,B 没有理由合作,A 预见到这一点,从一开始就不会信任 B。博弈结束,效率损失,两个人什么也得不到。

现在加一个环节:在博弈开始前,允许 B 向 A 发一条消息。B 说:我承诺会合作。

标准博弈论告诉我们,这句话不应该改变任何事。一次性博弈中的口头承诺是 cheap talk——廉价沟通,没有执行力,没有约束力,理性人应该直接忽略它。

但 2006 年发表在 Econometrica 上的一篇实验论文(Charness and Dufwenberg, 2006)讲了一个不同的故事。当 B 向 A 做出承诺后,A 的信任率显著上升,B 的合作率也显著上升。承诺改变了行为。一千多次被引的数据表明,空话一点都不空。

为什么?关键在于一个听起来有点绕但极为深刻的机制:承诺改变了 B 对 A 期望的信念。B 承诺之后,B 相信 A 现在期望他会合作。如果 B 接下来背叛了,他就让 A 失望了——而他知道自己让 A 失望了。这种知道自己辜负了对方期望的感受,就是内疚。内疚的强度取决于 B 的二阶信念——他认为 A 期望他做什么。承诺提升了这个二阶信念,从而加大了背叛的心理代价。

用论文中的术语说,承诺开启了一个 self-fulfilling circle of beliefs about beliefs——信念关于信念的自我实现循环。A 信任 B,B 感受到 A 的信任,B 不忍辜负这份信任,于是 B 合作,A 的信任得到回报。整个循环的起点,就是那句看似无足轻重的承诺。

这个用博弈论模型来严格分析内疚、承诺和信念的人,就是 Martin Dufwenberg。

瑞典人在美国:Dufwenberg 其人

Dufwenberg 是瑞典人,1995 年在乌普萨拉大学(Uppsala University)获得经济学博士学位,导师之一是著名博弈论学家 Jörgen Weibull。博士论文题目就预示了他此后三十年的方向:On Rationality and Belief Formation in Games——博弈中的理性与信念形成。

拿到博士学位后,他先后在蒂尔堡大学、斯德哥尔摩大学和波恩大学任职,2003 年移居美国,加入亚利桑那大学 Eller 管理学院,担任冠名教授长达二十多年。2025 年夏天,他以杰出教授身份加入普渡大学 Mitch Daniels 商学院。与此同时,他在哥德堡大学做了二十多年的客座教授,在博科尼大学也有长期访问职位。2023 年,哥德堡大学授予他荣誉博士学位,表彰他在心理博弈论领域的贡献。

Dufwenberg 的合作者遍布全球——从博科尼大学的理论家 Battigalli,到 UC Santa Barbara 的实验家 Charness,从诺贝尔奖得主 Selten,到他自己的儿子 Martin A. Dufwenberg。他的论文充满流行文化引用——感谢 Bruce Willis 提供标题灵感(Die Hard 的粉丝),用 L.A. Confidential 中 James Cromwell 的台词开篇互惠论文,引用丹麦诗人 Piet Hein 的小诗讨论后悔,在脚注里讲扑克故事。他在 Econometrica 正文里写 Did you figure this out?(你猜到了吗?),在另一篇论文脚注中写 Beware of people who do not goof around!(小心那些从不搞怪的人!)。学术上严谨、个性上鲜明,这种组合在博弈论界几乎独一无二。

他是心理博弈论(Psychological Game Theory, PGT)的主要建构者之一,三十年来只做一件事:把人类情感——内疚、愤怒、互惠、后悔、形象关注——纳入博弈论的形式化框架,然后问一个问题:当我们认真对待这些情感,博弈均衡会如何改变?

这篇文章先从 Dufwenberg 的核心理论贡献说起,然后沿着五个应用领域展示这个框架的威力,接着分析他与众不同的学术风格,最后提炼几条对年轻学者可能有用的建议。

一个核心洞察:效用可以依赖信念

从 GPS 到 Battigalli-Dufwenberg

1989 年,三位经济学家 Geanakoplos、Pearce 和 Stacchetti 在 Games and Economic Behavior 上发表了一篇奠基性论文。他们提出了一个简单但颠覆性的想法:一个人的效用不一定只取决于物质结果,也可以取决于他的信念。

这个想法的直觉并不陌生。你拿到年终奖 10 万块,开不开心?取决于你之前期望多少。期望 5 万时,10 万让你欣喜若狂;期望 20 万时,同样的 10 万让你沮丧。物质结果一样,心理感受完全不同。差别在哪里?在信念。

GPS 的框架把这个日常直觉变成了数学。但它有几个重要限制。它只能处理静态博弈,不能处理动态博弈中信念随时间更新的情况。它只考虑了玩家对自己结果的信念,没有考虑玩家对他人信念的关注。效用只能依赖于终端结果和信念,不能依赖于玩家的行动计划。分析只能在均衡条件下进行,不能处理非均衡情形。

这些限制意味着 GPS 框架虽然开创性,但无法分析我们最关心的那些心理现象。内疚需要二阶信念(你认为我期望你做什么)。互惠需要在动态博弈中推断意图。承诺需要分析沟通如何改变信念的更新过程。

Battigalli 和 Dufwenberg 花了近二十年时间,逐一突破这些限制。2009 年发表在 Journal of Economic Theory 上的论文构建了完整的动态心理博弈论框架。这篇论文后来入选了 JET 创刊 50 周年纪念特刊中 50 篇最具影响力的论文。2022 年,他们在 Journal of Economic Literature 上发表了长达 50 页的综述文章,系统梳理了整个 PGT 的理论版图。

信念关于信念为什么重要

为什么二阶信念——你认为我期望你做什么——如此关键?

回到承诺实验。B 是否合作,取决于背叛的心理成本。心理成本就是内疚。内疚有多强?取决于 B 认为 A 对他的期望有多高。如果 B 觉得 A 压根没指望他合作,那背叛也没什么好内疚的。但如果 B 觉得 A 真心相信他会合作——也就是说,B 的二阶信念很高——那背叛带来的内疚就很强。

承诺本身不产生任何物质后果,但它改变了二阶信念的结构。B 承诺之后,B 知道 A 现在有理由相信他会合作。B 的二阶信念上升了,内疚的门槛随之提高,合作变成了更优的选择。

在 PGT 的框架中,这个逻辑被干净地形式化了。一个玩家的效用由两部分组成:物质收益和心理效用。用最简化的方式写:

u_i = \pi_i + f(\text{信念层级})

物质收益 πi\pi_i 是传统博弈论关注的部分。心理效用 ff 依赖于信念层级——一阶信念(我认为会发生什么)、二阶信念(我认为你认为会发生什么)、甚至更高阶的信念。不同的情感对应不同的 ff 函数形式,但核心结构永远一样:效用依赖信念层级。

一个框架下的多种情感

这个结构的力量在于统一性。内疚、互惠、愤怒、后悔、形象关注——这些看似完全不同的情感,在 PGT 框架下都可以用同一个架构分析。变化的只是心理权重和 ff 的具体形式,不变的是效用依赖信念层级这一核心结构。

拿内疚来说。内疚厌恶(guilt aversion)的效用函数可以写成:

u_i = \pi_i - \theta_i \cdot \max\{0, E_j[\pi_j] - \pi_j\}

翻译成人话:Ej[πj]E_j[\pi_j] 是 j 期望从 i 那里得到的物质收益,πj\pi_j 是 i 实际给 j 的。当你给别人的少于别人期望的,内疚就出现了。θi\theta_i 是内疚敏感度——这个参数越大,你越在意别人的失望。

再看互惠。序贯互惠的效用函数有一个类似的结构:

u_i = \pi_i + \theta_{ij} \cdot \kappa_{ij} \cdot \lambda_{iji}

翻译一下:\kappa_{ij} 是 i 对 j 的善意,\lambda_{iji} 是 i 感知到的 j 对自己的善意。善意乘以感知善意——你对我好,我也对你好;你对我坏,我就报复你。\theta_{ij} 控制互惠的强度。

θ=0\theta = 0 时,所有心理项消失,回到标准的自利偏好模型。这就是 Dufwenberg 的 benchmark-then-extend 方法的数学基础——先用 θ=0\theta = 0 求解标准均衡,再看 θ\theta 足够大时均衡如何变化。每一个心理贡献都有一个清晰的对照组。

五个领域,一个框架

内疚与承诺:空话为什么不空

2006 年 Econometrica 论文的故事我们已经在开头讲过了。Charness 和 Dufwenberg 在信任博弈中引入廉价沟通,发现承诺显著提升了信任和合作。但这篇论文真正精妙之处,在于实验中的信念提取设计——他们不仅测量了行为(B 是否合作),还直接测量了 B 对 A 期望的二阶信念。数据表明,B 的合作行为与他的二阶信念显著正相关:B 越觉得 A 期望自己合作,B 就越倾向于合作。这个信念数据是检验内疚厌恶理论的关键证据。

在 Econometrica 论文的结尾,Dufwenberg 写下了一段颇具个人色彩的思辨:也许论文作者也在试图让审稿人对拒稿感到内疚呢?这种在顶刊论文中自嘲的勇气,在学术界并不多见。

这篇论文之后,Dufwenberg 和合作者们沿着承诺这条线索持续深挖。2010 年的实验发现,即使是赤裸裸的、没有任何对话背景的承诺,同样能提升合作率——承诺的力量不来自沟通的丰富性,而来自信念结构的改变。2019 年的实验走得更远:当一个人有机会发消息却选择不发,这个沉默本身也传递了信息。在信念的世界里,没有真正的沉默。2025 年的最新工作则从另一面补完了图景:承诺不仅通过内疚约束承诺者,还通过激活挫败感赋予了被承诺者惩罚的动机。承诺被打破时,受害者不仅失望,还可能愤怒。

承诺之所以有效,不是因为道德约束,不是因为声誉机制,而是因为承诺改变了二阶信念结构,从而改变了内疚的强度。这是一个纯粹的心理博弈论解释——不需要引入任何外部执行机制。

序贯互惠:善意如何在博弈树中展开

1993 年,Matthew Rabin 在 American Economic Review 上发表了一篇里程碑式的论文,将公平互惠引入博弈论。但 Rabin 的模型只适用于标准型博弈(normal-form game),不能处理扩展型博弈(extensive-form game)。

为什么这个限制很重要?想想现实中的互动。你先行动,我再行动。你先帮了我一个忙,我看到了你的善意,于是在下一步中回报你。序贯互动中,善意不是静态的判断,而是随着博弈展开不断被更新的推断。你的每一步行动,都在改变我对你意图的理解。

Dufwenberg 和 Kirchsteiger 在 2004 年发表在 Games and Economic Behavior 上的论文解决了这个问题。他们把 Rabin 的互惠模型从标准型博弈扩展到了扩展型博弈,让善意和感知善意依赖于博弈的序贯结构。核心创新是:意图可以在多阶段互动中被推断,推断过程依赖于每个信息集处玩家的行动选择。论文开头引用了 L.A. Confidential 中 James Cromwell 的台词——Reciprocity is the key to every relationship——互惠是每段关系的关键。

这个理论生出了一系列令人惊讶的应用。

2013 年的 “Hold-Up: With a Vengeance”(Dufwenberg, Smith, and Van Essen, Economic Inquiry, 2013)分析了经典套牢(hold-up)问题——一方做了专用性投资后,另一方事后敲竹杠。标准理论预测投资不足。Dufwenberg 加入互惠偏好后发现了反直觉的结果:报复心理可以缓解套牢问题——但有个条件,投资者必须保留剩余控制权。报复不是无差别地有效,它需要制度配合。

2020 年 “Banking on Reciprocity” 把互惠带进了银行体系。在没有存款保险的情况下,储户信任银行家,银行家出于互惠回报这份信任。引入存款保险后会怎样?直觉上你可能以为存款保险只会增加信任。但模型揭示了一个美妙的讽刺:存款保险让互惠型银行家的行为看起来与纯粹自利的银行家一模一样。善意被制度掩盖了——不是消失了,而是变得不可辨识。你无法通过观察行为来区分一个真正善良的银行家和一个纯粹逐利的银行家,因为保险制度抹平了行为差异。

2022 年的 “Mean Markets or Kind Commerce?” 更是直接挑战了一个流行的社会批判——市场腐蚀道德。这种观点认为市场让人变得自私。Dufwenberg 和合作者们用序贯互惠模型论证了相反的可能:市场互动可以激发善意,而不是压制善意。如果你关心交易对手福利(哪怕只是一点点),市场中的重复互动会放大善意,而不是侵蚀它。

欺骗:不是厌恶作弊,是厌恶被认为作弊

实验经济学中有一个经典范式:掷骰子报告实验(来自 Fischbacher and Föllmi-Heusi 的开创性工作)。你私下掷一个骰子,然后报告结果,报的数字就是你拿到的钱。没人能验证你实际掷出了几。标准理论预测所有人都报最大值——反正没人查。但实验数据一再显示,人们并不都报最大值。他们会作弊,但只是部分作弊。报告的数字分布明显偏向高值,但没有全部集中在最高点。

为什么人们只是部分作弊?2018 年,Dufwenberg 和他的儿子 Martin A. Dufwenberg 在 Journal of Economic Theory 上发表了 “Lies in Disguise”,提出了一个新解释。这是一篇理论论文,父子二人构建了一个心理博弈论模型,引入了一个新概念:perceived cheating aversion——感知作弊厌恶。他们的核心洞察是:人们厌恶的不是作弊本身,而是被观众认为是作弊者。

这个区分看似微妙,实则产生截然不同的预测。如果人们厌恶的是作弊本身,无论别人怎么做,你都应该尽量诚实。但如果人们厌恶的是被认为在作弊,你的最优策略就取决于别人怎么做。当每个人都报最大值时,你报最大值反而最显眼——因为观众知道不可能所有人都掷出了 6。所以人们会策略性地选择一个不太极端的数字,既捞到好处,又不至于看起来太像作弊者。

这产生了论文中那个名字极为生动的均衡——sailing to the ceiling(驶向天花板)。想象所有人的报告像一群船慢慢向上飘,接近但不到达天花板。均衡不在最大值,而在略低于最大值的某个点——恰好是那个让你的作弊行为隐入人群的点。

这篇论文和 Gneezy(AER, 2005)的经典欺骗实验形成有趣的互补。Gneezy 发现欺骗行为对后果敏感——撒谎对自己好处大而对别人伤害小时,人们更愿意撒谎。Dufwenberg 父子的贡献是引入了观众维度:不仅后果影响欺骗,被他人如何看待也影响欺骗。这两个维度——后果敏感和形象关注——共同构成了理解人类欺骗行为更完整的图景。

父子合作本身就是个好故事。这篇论文发表在顶级理论期刊上,数学严格,质量过硬到让人完全忘记作者之间的血缘关系。学术面前,只看质量,不论辈分。

税收逃避与反腐败:内疚影响的不是你以为的那个人

PGT 的政策应用同样出人意料。

2022 年的 “Tax Evasion with a Conscience”(Dufwenberg and Nordblom, Journal of Public Economics, 2022)分析了一个检查博弈:纳税人决定逃多少税,税务官决定以多大概率检查。标准模型的均衡预测:逃税金额和检查频率由罚款率和检查成本决定。

Dufwenberg 加入内疚之后,发现了一个反直觉的结果。纳税人可能对逃税感到内疚——这合乎直觉。但均衡分析表明,逃税的金额并没有因为内疚而减少。减少的是检查频率。

为什么?因为在混合策略均衡中,纳税人的逃税概率取决于检查成本和罚款率(这些是检查者的参数),而检查概率取决于纳税人的逃税收益和心理成本(包括内疚)。当纳税人有内疚时,他逃税的心理成本上升了,这意味着需要更低的检查概率就能维持均衡。内疚通过博弈结构传递到了另一方的行为上。

这是一个典型的 Dufwenberg 式惊喜——心理因素改变均衡的方式完全不是你预想的方向。你以为内疚会让人少逃税。均衡分析告诉你:内疚让检查者少检查。内疚影响的不是感受内疚的那个人,而是博弈的另一方。这种通过均衡结构产生的间接效应,正是 PGT 框架的独特贡献——靠直觉想不到,必须做完均衡分析才能看清全貌。

更早的一篇论文 “Blowing the Whistle”(Apesteguia, Dufwenberg, and Selten, Economic Theory, 2007)与诺贝尔奖得主 Reinhard Selten 合作,分析了反卡特尔宽免政策。Dufwenberg 和 Spagnolo 在另一条线索上研究了一个争议性提案——让行贿者合法化以鼓励举报受贿者。他们论证了这个看似巧妙的提案可能适得其反:如果行贿者知道自己不会被追诉,他们反而会更肆无忌惮地行贿。善意的制度设计如果忽视信念结构的变化,可能产生与初衷相反的效果。

疫情与后悔:新前沿

2020 年代,Dufwenberg 的研究进入了两个全新的领域。

第一个是疫情中的行为。2025 年与医学科学家 Kathryn Reed 合作的论文把 PGT 应用于一个公共卫生难题:为什么有些人明知疫苗有效却拒绝接种?为什么有些人在疫情中坚决不戴口罩?

标准经济学的解释通常诉诸信息不足或非理性。Dufwenberg 的解释完全不同:拒绝疫苗和口罩可以是一种理性的形象投射。在某些社交圈子中,不戴口罩传递了一种信号——我是那种不害怕、不从众的人。这种信号有社交价值。当形象关注足够强时,即使知道口罩有用,不戴口罩也可能是一个均衡行为。Dufwenberg 在论文中用了一句很有画面感的话来描述这个均衡:Oops, i is the only one masking-up here——糟糕,只有我一个人在戴口罩。

更让人警觉的政策含义是:公共卫生宣传如果改变了口罩的信号价值(让戴口罩看起来像胆小的标志),反而可能减少口罩使用。善意的干预因为改变了信念结构而产生反效果。这篇论文跨越了经济学和医学的学科边界——Dufwenberg 需要同时说服两个截然不同的读者群体,而他做到了。

第二个新前沿是博弈中的后悔。与 Battigalli 和 Lin 合作的 “Regret in Games”(2025)开辟了一个全新方向。传统博弈论中,博弈结束后玩家获得什么信息并不影响博弈中的行为——因为效用只取决于结果。但如果人们会后悔呢?

后悔取决于你事后得知:如果当初选了另一条路会怎样。这意味着博弈结束时的信息结构——你能看到什么反事实结果——第一次在博弈论中变得行为相关。如果你知道自己在博弈结束后会看到另一条路的结果,你可能会在博弈中选择更保守的策略来避免后悔。

这篇论文有一个预测尤其有趣:信息回避。某些情况下,玩家宁愿不知道自己错过了什么,以避免后悔的痛苦。这不是非理性,而是 PGT 框架下完全理性的选择——因为效用不仅取决于你得到了什么,还取决于你知道了什么。想想那些不敢查看股票账户的投资者,或者不愿得知自己差一分没考上的学生——他们可能在做一个最优化决策,只不过最优化的对象不仅是物质收益,还包括心理安宁。

Dufwenberg 的学术风格

读过几篇 Dufwenberg 的论文之后,你会发现他的研究辨识度极高。这种辨识度不仅来自主题的一致性,更来自方法、写作和个性上几个鲜明特征。

先直觉后形式化

翻开任何一篇 Dufwenberg 的论文,你不会在前两页看到任何公式。你看到的是一个故事——一个有名字的角色、一个具体的情境、一个让人直觉上就觉得现有理论说不通的场景。

Ann 和 Bob 在信任博弈中。Penny 和 Abe 在讨论婚姻中的承诺。两个渔夫决定是否合作。这些有名有姓的角色不是装饰——他们是理论构建的起点。Dufwenberg 不是先写公式再解释,而是先让你理解为什么需要这个公式,然后再给你看公式。正如他自己所说:Simplicity is a virtue that facilitates the path to epiphany——简约是通往顿悟的美德。

先动机后形式化的原则贯穿他写作的每一个细节。每一个公式之后都紧跟着一段 In words... 的口语翻译。他甚至发明了一种从右到左解读公式的方法——先解释公式最右边的项(通常是最直觉的部分),再逐步往左推。他用 Ecco(意大利语,相当于 here is)作为个人签名式的过渡词。他用方括号直接邀请读者参与:[Stop and think before reading on!]——在正式的博弈论论文中,这几乎前所未有。

他从不以文献综述开场。他的开头可以是一句谚语(A clear conscience is a good pillow——清白的良心是最好的枕头),一句电影台词,一首丹麦小诗,一个丢钱包的场景,或者一个全大写的宣言(MUCH OF HUMAN ACHIEVEMENT is produced in partnerships)。每一种开头都是为了同一个目的:在第一段就把读者拉进情境。

基准再扩展

Dufwenberg 几乎所有论文都遵循同一个分析步骤:先用标准自利偏好求解均衡(benchmark),再引入心理因素,展示均衡如何变化(extend)。

这个方法看起来简单,学术价值却不可低估。它保证了每一个心理贡献都有清晰的对照组。你不是在说我的模型能解释现象,而是在说标准模型在这里预测了 X,加入心理因素后变成了 Y,而数据支持 Y。

税收论文中,他先求出标准的检查博弈均衡,然后展示加入内疚后检查频率下降而逃税金额不变。银行论文中,他先求出没有存款保险时的互惠均衡,然后展示保险如何让互惠变得不可辨识。每一次惊喜都建立在你以为会怎样和实际上怎样的清晰对比之上。这种方法的精妙之处在于:反直觉发现因为有了透明的参照点而变得更加有力。

命名的力量与坦诚的局限

Dufwenberg 给均衡取名字。The Suspicious Spouses(多疑的夫妻)、The Trusting Twosome(信任的二人组)、The Mixed Matrimony(混合婚姻)、Sailing to the Ceiling(驶向天花板)、The Vengeance Equilibrium(复仇均衡)。这些名字把抽象的均衡概念变成了可以记住的画面。你可能忘记一个三行的数学条件,但你不会忘记多疑的夫妻这个意象。

他给概念起直觉化的标签——guilt from blame(归咎内疚)、perceived cheating aversion(感知作弊厌恶)、belief-dependent motivation(信念依赖动机)。每个术语都在告诉你它是什么意思。他系统性地把结果标记为 Observation 而非 Theorem——这个刻意谦逊的选择传递了一种态度:经济意义比数学复杂性更重要。

但在命名和标签之外,Dufwenberg 最令人敬佩的品质或许是他对自己论文做不到什么始终坦诚。We are not ready to offer a more detailed explanation for our result(我们还没有准备好提供更详细的解释)。We didn't in our wildest dreams predict the astonishing level of honesty(我们做梦也没想到如此惊人的诚实水平)。I have not yet been able to construct with it a satisfactory model(我还没能用它构建一个令人满意的模型)。

这些句子不是藏在脚注里,而是出现在正文中。当一个学者反复告诉你他不知道什么,你会更倾向于相信他说知道的那些东西。学术诚实不是弱点——它是一种信号,传递的信息是:这个学者的标准很高,他的其他主张值得认真对待。

合作者光谱

Dufwenberg 的合作者图谱本身就是 PGT 作为统一框架之强大的最好证明——同一个理论工具箱与不同类型的学者对话,生产出不同风格的论文。

合作者机构合作类型代表作
Pierpaolo Battigalli博科尼大学理论基础JET 2009, JEL 2022, Regret 2025
Georg Kirchsteiger布鲁塞尔自由大学序贯互惠GEB 2004, Mean Markets 2022
Gary CharnessUC Santa Barbara承诺实验Econometrica 2006, AER 2011
Uri GneezyUC San Diego早期实验GEB 2000 (Lost Wallet)
Geir Asheim奥斯陆大学认识博弈论GEB 2003, EJ 2003
Reinhard Selten波恩大学(诺奖得主)反卡特尔政策ET 2007
Martin A. DufwenbergDufwenberg 之子作弊理论JET 2018
Kathryn Reed医学科学家疫情分析Pandemic 2025
Katarina Nordblom哥德堡大学税收道德JPubE 2022

从纯理论家到实验家,从诺奖得主到医学科学家,从同代学者到自己的儿子——合作的广度不是社交能力的体现,而是框架通用性的证明。一个理论如果只能与同一类学者对话,它的适用范围一定有限。PGT 能与如此不同的合作者产生有意义的论文,本身就说明了这个框架的生命力。

但无论与谁合作,Dufwenberg 的声音始终可辨。有名有姓的角色(Ann, Bob, Cleo, Dan)、文化引用(电影台词、谚语、诗歌)、坦率的语气、对信念的执着——这些标记在每篇论文中都在场。We hope our text exudes that combining experiments and theory is fun——我们希望我们的文字散发出理论与实验结合的乐趣。这句话本身就是他学术风格的完美示范。

PGT 的边界与挑战

任何理论框架都有边界,PGT 也不例外。对年轻学者来说,了解一个框架的局限和它的能力同样重要。这里谈三个。

首先是高阶信念的测量问题。PGT 的核心是二阶信念——你认为我期望你做什么。但实验中,被试真的能准确报告自己的二阶信念吗?Dufwenberg 和 Charness 开创了直接测量法(在问卷中询问被试对他人期望的猜测),后来被广泛使用,但可靠性仍是活跃的研究议题。被试报告的信念是真实的心理状态,还是合理化的猜测?

其次是参数自由度。PGT 模型中的敏感度参数 θ\theta(内疚敏感度、互惠敏感度等)给了模型很大的灵活性。θ\theta 足够大时,几乎任何行为都可以被解释为某种心理均衡。这引出一个根本性的方法论问题:PGT 模型可证伪性有多强?Dufwenberg 自己的回应是通过 benchmark-then-extend 方法来约束这种灵活性——先展示标准模型的预测,再展示加入心理因素后预测如何改变,用数据来判断哪个预测更准确。但批评者可能会指出,这种做法并没有真正解决事先确定 θ\theta 取值的问题。

最后是 PGT 与其他社会偏好模型的关系。Fehr-Schmidt 的不平等厌恶模型和 Bolton-Ockenfels 的 ERC 模型用结果(而不是信念)来解释合作和公平行为。两种方法各有优劣:结果导向的模型更简洁、更容易检验,但无法解释承诺为什么有效(因为承诺不改变物质结果)。信念导向的 PGT 模型可以解释更多现象,但要求测量更困难的心理变量。Dufwenberg 对竞争理论的态度一向是 complementary(互补)而不是 superior(优越)——他从不宣称 PGT 是唯一正确的框架,而是强调它在信念起关键作用的场景中具有独特优势。

从 Dufwenberg 身上能学到什么

Dufwenberg 三十年的工作,对正在寻找研究方向的年轻学者来说,有几条可以直接借鉴的策略。

从心理学出发,而不是从数学出发

Dufwenberg 每一个重要贡献都始于一种心理上合理的动机——内疚、互惠、后悔、形象关注。他从不先写一个漂亮的数学模型再寻找应用场景。他的研究问题永远是:如果在战略情境中认真对待这种情感,会发生什么?

你的下一个研究项目可以这样开始:想一种人们在经济决策中明显感受到但经济学模型忽略了的情感。嫉妒?自豪?羞耻?焦虑?然后问:如果我把这种情感放进一个简单的博弈中,标准均衡会改变吗?如果答案是会,而且改变的方向出人意料,你就有了一篇论文的雏形。

构建统一框架,然后反复应用

Dufwenberg 整个职业生涯建立在 PGT 这一个框架上。但通过改变情感类型和应用领域,他产出了几十篇发表在顶级期刊上的论文。内疚 + 信任博弈 = 承诺论文。互惠 + 投资博弈 = 套牢论文。形象关注 + 公共卫生 = 疫情论文。后悔 + 信息结构 = 后悔论文。

核心策略是:投资于一个足够通用的理论工具箱,然后在多个领域中展示它的力量。不要每写一篇论文就发明一套新理论。好的框架应该像一把趁手的工具——同一个工具,面对不同问题,发挥不同功能。

让形式化为直觉服务

如果你无法用日常语言向一个聪明的非专业人士解释你的模型在做什么,这个模型可能还不够成熟。在写论文时,试试 Dufwenberg 的方法:先写故事(有名字的角色、具体的场景、直觉上的困惑),然后写模型,然后写 In words... 把模型翻译回日常语言。如果翻译回来的那段和开头的故事对不上,说明模型和直觉之间还有裂缝,需要修补。

承认你不知道什么

年轻学者往往过度推销结果。每个发现都被包装成改变了我们对 X 的理解。每个局限性都被藏在论文最不显眼的角落。

Dufwenberg 的做法恰好相反。他把局限性放在引言里。他用 We are not ready to offer a more detailed explanation 这样的句子——不是藏在脚注中,而是出现在正文中。他对竞争理论始终给予尊重。

学术诚实的回报是信任。当一个学者反复告诉你他的论文做不到什么,你会更相信他说做到的那些东西。这种品质不是天生的,可以训练——下次写论文时,试着在引言中用一两句话坦率地说明你的研究不做什么、不能回答什么问题。你会发现,坦诚不仅不会削弱论文,反而会增强说服力。

结语:信念如何塑造世界

让我们回到开头的那个承诺实验。

B 向 A 说了一句话:我承诺会合作。这句话改变了 A 的信念。A 开始相信 B 会合作。B 感知到 A 的信任,不忍辜负。B 合作了。A 的信任得到了回报。

一句承诺改变了信念,信念改变了行为,行为改变了结果。

这个简单的链条,就是 Martin Dufwenberg 三十年工作的缩影。从 1995 年在乌普萨拉获得博士学位开始,到 2023 年获得哥德堡大学荣誉博士,再到 2025 年加入普渡大学担任杰出教授,他用一个框架——心理博弈论——持续地探索同一个问题:当效用依赖于信念,世界会变成什么样?

答案远不止于实验室。税务官的检查频率、银行家的风险偏好、疫情中人们是否戴口罩、市场交易是否腐蚀道德、承诺为什么有效、沉默为什么不沉默——这些现实世界的现象,都可以通过人们如何看待彼此的信念来理解。

用 Dufwenberg 自己最喜欢的那个反复出现的句子来说:Promises foster trust and cooperation. 承诺促进信任与合作。这句话在他三十年间发表的八篇承诺论文中反复出现,措辞微妙演变,但信念从未改变。

对年轻学者而言,他三十年的经验或许可以凝练为一条核心建议——找到经济学模型中被遗漏的那种情感,用最简单的博弈来展示它如何改变均衡,然后诚实地告诉读者你发现了什么,以及你还不知道什么。

Charness and Dufwenberg, “Promises and Partnership,” Econometrica, 2006 Battigalli and Dufwenberg, “Dynamic Psychological Games,” Journal of Economic Theory, 2009 Battigalli and Dufwenberg, “Belief-Dependent Motivations and Psychological Game Theory,” Journal of Economic Literature, 2022 Dufwenberg and Kirchsteiger, “A Theory of Sequential Reciprocity,” Games and Economic Behavior, 2004 Dufwenberg and Dufwenberg, “Lies in Disguise,” Journal of Economic Theory, 2018 Dufwenberg and Nordblom, “Tax Evasion with a Conscience,” Journal of Public Economics, 2022 Apesteguia, Dufwenberg, and Selten, “Blowing the Whistle,” Economic Theory, 2007 Dufwenberg, Smith, and Van Essen, “Hold-Up: With a Vengeance,” Economic Inquiry, 2013 Geanakoplos, Pearce, and Stacchetti, “Psychological Games and Sequential Rationality,” Games and Economic Behavior, 1989 Rabin, “Incorporating Fairness into Game Theory and Economics,” American Economic Review, 1993

related