第二十天读书摘录:在纳什的两篇著名论文《多人博弈中的均衡点》与《非合作博弈》中,“纳什均衡”的理念得以提出。
“纳什均衡”的内涵,主要揭示了在多人参与的游戏或策略选择中,各方基于其他参与者的战略所选择的最优战略。一系列如此的战略选择和匹配所构成的模式,本质上即一种相互制衡的状态,这一状态通常无人愿意主动打破,因为任何一方的策略变动都可能带来收益的降低。这种平衡状态,便被称作“纳什均衡”。
这一概念主要应用于非合作博弈的研究中,因此也常被称作非合作博弈均衡。借用简单的比喻来说明,“纳什均衡”犹如锅中翻滚的乒乓球。想象一下将乒乓球置于锅中,它们会在锅里来回滚动,彼此碰撞并最终达到静止平衡的稳定状态。此时若触碰任何一颗球,都会影响这一平衡的维持。在比喻中,乒乓球代表各参与者的策略,而它们最终在锅底形成的静止平衡,正是“纳什均衡”的体现。
在“纳什均衡”的框架下,各方的策略制定都是对其他方策略的响应,目的在于实现自身利益的最大化。
当我们将均衡分为正负两面时,我们发现好与坏的均衡并非是静态不变的。以下将通过一个故事实例来进一步阐释这一观点。
为了更好地理解均衡的转换机制,我们将故事中的博弈行为抽象为简单的博弈模型。设损毁瓜苗为A策略,其收益为0;而选择相互帮助则为B策略,其收益为10。博弈矩阵图如下所示。
在这场博弈中,存在两个“纳什均衡”:一是如果一方选择损毁瓜苗,另一方的最优策略即为报复;另一个则是双方同时选择合作与互助。这两个均衡的最终结果截然不同。第一个结果是(0,0)双败结局,代表坏的均衡;而第二个结果是(10,10)双赢局面,则代表了好的均衡。(0,10)和(10,0)这样的策略组合并不构成“纳什均衡”。
根据故事背景,楚国最初选择了A策略。按照博弈论的分析,这被视为魏国的最佳反应策略——即报复。这种选择与我们日常的行为习惯相符,达成了一种看似不利的平衡——坏的均衡。魏国人的行动感化了对方,选择了B策略。这样双方形成了一种新的平衡状态——好的均衡。
从上述故事中我们可以看出:好与坏的均衡并非一成不变,它们之间有时会相互转化。