ゲーム理論 において ε 均衡 (イプシロンきんこう,epsilon-equilibrium) または近似ナッシュ均衡 (near-Nash equilibrium) とは,ナッシュ均衡 の条件を近似的にみたすような戦略 プロファイルのことである.
ゲームと非負の実数 ε とを所与として,戦略プロファイルが ε 均衡であるとは,どのプレーヤーにとっても,自分の戦略からの単独での逸脱によって,期待利得を ε より大きく改善することができないことをいう.任意のナッシュ均衡 は,ε = 0 の場合の ε 均衡に等しい.
形式的に書こう.N 人のプレーヤーがいて,各プレーヤーの行動集合が
A
i
{\displaystyle A_{i}}
, 効用関数が u であるようなゲームを
G
=
(
N
,
A
=
A
1
×
⋯
×
A
N
,
u
:
A
→
R
N
)
{\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N},u:A\to \mathbb {R} ^{N})}
とする.戦略の組
σ
∈
Δ
=
Δ
1
×
⋯
×
Δ
N
{\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}}
が G の ε 均衡であるとは,
u
i
(
σ
)
≥
u
i
(
σ
i
′
,
σ
−
i
)
−
ε
for all
σ
i
′
∈
Δ
i
,
i
∈
N
{\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}',\sigma _{-i})-\varepsilon \;{\mbox{for all}}\;\sigma _{i}'\in \Delta _{i},i\in N}
であるときをいう.
ε 均衡の概念は,無限に継続する可能性のある確率ゲーム の理論において重要である.ナッシュ均衡 が存在しないが,0 より厳密に大きい任意の ε について ε 均衡が存在するような,簡単な確率ゲームの例がある.
おそらくもっとも簡単な例は,エヴェレット により提案された,次のようなマッチングペニー の変種だろう.プレーヤー 1 はペニー硬貨を隠し,プレーヤー 2 はそれが表か裏かを推測する.プレーヤー 2 が正しく当てたならば,プレーヤー 1 からペニーをもらってゲームが終了する.プレーヤー 2 が,表と推測して外したならば,両プレーヤーの利得を 0 としてゲームが終了する.プレーヤー 2 が裏と推測して外したならば,ゲームは繰りかえす .もしゲームが永久に続くならば,両プレーヤーの利得は 0 になる.
パラメータ ε > 0 を所与として,プレーヤー 2 が,(ゲームのステージによらず,それ以前のステージとも独立に) 表を確率 ε, 裏を確率 1 − ε と推測するような任意の戦略プロファイルは,このゲームの ε 均衡になる.このような戦略プロファイルにおけるプレーヤー 2の 期待利得は少なくとも 1 − ε になる.しかし,ちょうど 1 の期待利得を保証するようなプレーヤー 2 の戦略は存在しないことが簡単にわかる.したがって,このゲームはナッシュ均衡 をもたない.
べつの簡単な例として,T 期間の有限回繰りかえし 囚人のジレンマ を考え,利得は T 期間の平均で与えられるものとしよう.このゲームの唯一のナッシュ均衡 は,各期において裏切りを選ぶというものである.ここで,2 つの戦略,しっぺ返し戦略 とグリムトリガー を考えよう.しっぺ返しもグリムトリガーもこのゲームのナッシュ均衡にならないが,どちらもある正なる ε について ε 均衡になる.ε の許容される値は,ステージゲーム利得と繰りかえしの期間数 T に依存する.
経済学 において,純粋戦略 ε 均衡の概念は,混合戦略 によるアプローチが現実的でないとみなされるときに使われている.純粋戦略 ε 均衡においては,各プレーヤーは,最適な純粋戦略から ε 以内だけ離れた純粋戦略を選択する.例として,ベルトラン・エッジワースモデル (英語版 ) においては,純粋戦略均衡は存在しないが,純粋戦略 ε 均衡は存在しうる.
Dixon, H Approximate Bertrand Equilibrium in a Replicated Industry , Review of Economic Studies, 54 (1987), pages 47-62.
H. Everett. "Recursive Games". In H.W. Kuhn and A.W. Tucker, editors. Contributions to the theory of games , vol. III, volume 39 of Annals of Mathematical Studies . Princeton University Press, 1957.
Leyton-Brown, Kevin; Shoham, Yoav (2008), Essentials of Game Theory: A Concise, Multidisciplinary Introduction , San Rafael, CA: Morgan & Claypool Publishers, ISBN 978-1-59829-593-1 , http://www.gtessentials.org . An 88-page mathematical introduction; see Section 3.7. Free online at many universities.
R. Radner. Collusive behavior in non-cooperative epsilon equilibria of oligopolies with long but finite lives , Journal of Economic Theory, 22 , 121-157, 1980.
Shoham, Yoav; Leyton-Brown, Kevin (2009), Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations , New York: Cambridge University Press , ISBN 978-0-521-89943-7 , http://www.masfoundations.org . A comprehensive reference from a computational perspective; see Section 3.4.7. Downloadable free online .
S.H. Tijs. Nash equilibria for noncooperative n-person games in normal form , Siam Review, 23 , 225-237, 1981.
定義 解概念 と精緻化戦略 ゲームのクラス ゲーム 定理 主要人物 関連項目