ε-均衡 - 维基百科,自由的百科全书

博弈论中,ε-均衡Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡[1][2]

定义

[编辑]

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡[3]

从形式上来定义,令以下为N人对策模型[4]

,其中为第个局中人的纯策略集,效用函数

当一组策略满足以下条件时:

,有

则称这个策略组合为该对策模型的一个ε-均衡。

举例

[编辑]

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。

参考文献

[编辑]
  1. ^ Leyton-Brown, Kevin; Shoham, Yoav. Essentials of Game Theory: A Concise, Multidisciplinary Introduction. San Rafael, CA: Morgan & Claypool Publishers. 2008 [2021-02-10]. ISBN 978-1-598-29593-1. (原始内容存档于2019-04-10). 
  2. ^ 徐渝. 《对策论(下册)》. 北京: 清华大学出版社. 2005. ISBN 9787302104551. 
  3. ^ Shoham, Yoav; Leyton-Brown, Kevin. Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations. New York: Cambridge University Press. 2009 [2021-02-10]. ISBN 978-0-521-89943-7. (原始内容存档于2011-05-01). 
  4. ^ S.H. Tijs. Nash equilibria for noncooperative n-person games in normal form. SIAM Review. 1981, (23): 225-237.