Теория игр

Эволюционная теория игр

Эволюционная теория игр применяет концепцию равновесия к популяциям без предположения о рациональности. Репликаторная динамика объясняет, как стратегии закрепляются через отбор - процесс, который оптимизирует без планирования.

**Биология:** ритуализованные бои, половое соотношение 1:1, альтруизм в колониях пчёл - все предсказаны ESS-анализом
**TCP/IP:** алгоритм управления перегрузкой сети реализует репликаторную динамику для пропускной способности
**Поведенческая экономика:** модели ограниченной рациональности (imitation dynamics) как приближение к эволюционному равновесию
**Языковая эволюция:** модели Nowak-Komarova показывают, что грамматика стабилизируется как ESS в популяции говорящих

Предварительные знания

Равновесие Нэша в смешанных стратегиях
Повторяющиеся игры
Основы теории вероятностей

Повторяющиеся игры и народная теорема

Репликаторные уравнения

Джон Мэйнард Смит в 1973 году ввёл понятие эволюционно-стабильной стратегии (ESS) для объяснения ритуализованных боёв у животных: почему олени в поединках используют рога, но редко убивают друг друга? Ответ - не сострадание, а эволюционное равновесие. В популяции страусов с 10 000 особей Hawks и Doves поддерживают строго определённые доли, предсказанные моделью.

Что описывает репликаторное уравнение dx_i/dt = x_i * (f_i(x) - bar_f(x))?

Репликаторное уравнение (Taylor-Jonker, 1978) моделирует селекцию: доля стратегии x_i растёт пропорционально тому, насколько её приспособленность f_i(x) выше средней bar_f(x) = sum_j x_j f_j(x). Это детерминированный предел стохастической эволюции при N → inf.

Эволюционно стабильные стратегии (ESS)

Игра Hawk-Dove моделирует конфликт за ресурс. Hawk - всегда сражаться; Dove - отступить при встрече с Hawk, разделить ресурс с другим Dove. При V > C Hawks доминируют (выгоднее всегда сражаться); при V < C возникает смешанное ESS с долей Hawks p* = V/C.

Какому условию удовлетворяет эволюционно стабильная стратегия x*?

Maynard Smith & Price (1973): ESS x* - стратегия, против которой никакая мутантная стратегия x´ не может закрепиться в популяции. Формально: u(x*, x*) > u(x´, x*), или u(x*, x*) = u(x´, x*) и u(x*, x´) > u(x´, x´). ESS - подмножество равновесий Нэша.

Применения: hawk-dove, кооперация, машинное обучение

ESS применяется за пределами биологии: в сетевых протоколах (TCP congestion control реализует репликаторную динамику), в поведенческой экономике (ограниченная рациональность как аппроксимация ESS-динамики) и в языковой эволюции (Nowak, Komarova 2001).

Связь между ESS и концепциями классической теории игр: ESS => NE (первое условие - это условие Нэша). Строгое NE => ESS (строгость гарантирует второе условие). Смешанное NE может быть ESS (при выполнении второго условия) или нет.

В игре hawk-dove какая стратегия является ESS при V < C (стоимость ранения превышает приз)?

В классической игре Maynard Smith о борьбе за ресурс ценности V с риском ранения C: при V < C ни чистая hawk, ни чистая dove не ESS. Смешанная p = V/C стабильна: при p > V/C доходы hawk падают, при p < V/C - растут. Это объясняет наблюдаемое распределение агрессии в популяциях животных.

Связи с другими областями

Эволюционная теория игр соединяет математическую биологию, экономику и теорию обучения.

Повторяющиеся игры и народная теорема — Эволюционная динамика выбирает среди равновесий, которые народная теорема допускает
Эволюционная теория игр — Базовый курс по эволюционным стабильным стратегиям и репликаторной динамике
Теория игр в ML — Мультиагентные системы и GAN-обучение моделируются репликаторной динамикой

Итоги

ESS: sigma* эволюционно стабильна, если мутант не может вторгнуться; влечёт NE, но не наоборот
Репликаторная динамика: dx_i/dt = x_i*(f_i - f_bar); стратегии с приспособленностью выше средней растут в частоте
Hawk-Dove: ESS доля Hawks = V/C при V < C; при нарушении баланса система возвращается к p*
Фундаментальная теорема: средняя приспособленность f_bar монотонно растёт вдоль траекторий репликатора
Применения: биология (бои, соотношение полов), сети (TCP), поведенческая экономика, языковая эволюция

Вопросы для размышления

Почему каждая ESS является равновесием Нэша, но не каждое NE является ESS?
Как репликаторная динамика связана с алгоритмами обучения с подкреплением в многоагентных системах?
Почему половое соотношение 1:1 является ESS в большинстве популяций, даже когда самок явно «нужно» больше?

Связанные уроки

la-25-quadratic-forms

Репликаторные уравнения

Что описывает репликаторное уравнение dx_i/dt = x_i * (f_i(x) - bar_f(x))?

Эволюционно стабильные стратегии (ESS)

Какому условию удовлетворяет эволюционно стабильная стратегия x*?

Применения: hawk-dove, кооперация, машинное обучение

В игре hawk-dove какая стратегия является ESS при V < C (стоимость ранения превышает приз)?

Итоги

ESS: sigma* эволюционно стабильна, если мутант не может вторгнуться; влечёт NE, но не наоборот

Репликаторная динамика: dx_i/dt = x_i*(f_i - f_bar); стратегии с приспособленностью выше средней растут в частоте

Hawk-Dove: ESS доля Hawks = V/C при V < C; при нарушении баланса система возвращается к p*

Фундаментальная теорема: средняя приспособленность f_bar монотонно растёт вдоль траекторий репликатора

Применения: биология (бои, соотношение полов), сети (TCP), поведенческая экономика, языковая эволюция