Равновесие дрожащей руки | |
---|---|
Концепция решения в теории игр | |
Связанные множества решений | |
Надмножества | Равновесие Нэша |
Подмножества | Собственное равновесие |
Факты | |
Авторство | Рейнхард Зельтен |
Равновесие дрожащей руки (англ. trembling hand perfect equilibrium) — принцип оптимальности в некооперативных играх, представляющий собой равновесие Нэша, обладающее дополнительным свойством устойчивости к достаточно малым отклонениям игроков от равновесных стратегий. Сформулировано Р. Зельтеном в работе 1975 года[1].
Пусть задана игра в нормальной форме . Набор смешанных стратегий игроков q называется равновесием дрожащей руки, если существует такая последовательность вполне смешанных стратегий {pε} → q, что стратегия qi является наилучшим ответом игрока i на стратегии остальных игроков из набора pε.
Как и равновесие Нэша, равновесие дрожащей руки существует в смешанном расширении в любой некооперативной игре с конечными множествами стратегий игроков.
Приведенная в таблице игра двух лиц отображенная в нормальной форме имеет два равновесия Нэша: (Верх, Лево) and (Низ, Право). Однако, только (В, Л) является равновесием дрожащей руки.
Лево | Право | |
---|---|---|
Верх | 1, 1 | 2, 0 |
Низ | 0, 2 | 2, 2 |
Действительно, предположим, что игрок 1 использует смешанную стратегию , для некоторого . Ожидаемый выигрыш игрока 2, если он играет Лево, составит:
Ожидаемый выигрыш игрока 2 при выборе стратегии Право составит:
Для достаточно малых значений ε, игрок 2 максимизирует свой ожидаемый выигрыш, используя стратегию Право с минимальным весом. Аналогично, игрок 1 должен использовать с минимальным весом стратегию Низ, если игрок 2 использует смешанную стратегию . Следовательно, (В, Л) является равновесием дрожащей руки.
Аналогичные рассуждения не выполняются для профиля стратегий (Н, П). Действительно, предположим, что игрок 1 использует смешанную стратегию . Ожидаемый выигрыш игрока 2, если он использует Л, составит:
Ожидаемый выигрыш игрока 2 при использовании стратегии П:
В этом случае для любых положительных значений ε, игрок 2 максимизирует свой ожидаемый выигрыш, используя П с минимальной частотой. Следовательно, (Н, П) не является равновесием дрожащей руки, так как при небольшой вероятности ошибок игрок 2 максимизирует свой ожидаемый выигрыш, отклоняясь от данной стратегии.
Это заготовка статьи по математике. Помогите Википедии, дополнив её. |