Теория игр
Эволюционная теория игр
Эволюционная теория игр применяет концепцию равновесия к популяциям без предположения о рациональности. Репликаторная динамика объясняет, как стратегии закрепляются через отбор - процесс, который оптимизирует без планирования.
- **Биология:** ритуализованные бои, половое соотношение 1:1, альтруизм в колониях пчёл - все предсказаны ESS-анализом
- **TCP/IP:** алгоритм управления перегрузкой сети реализует репликаторную динамику для пропускной способности
- **Поведенческая экономика:** модели ограниченной рациональности (imitation dynamics) как приближение к эволюционному равновесию
- **Языковая эволюция:** модели Nowak-Komarova показывают, что грамматика стабилизируется как ESS в популяции говорящих
Предварительные знания
- Равновесие Нэша в смешанных стратегиях
- Повторяющиеся игры
- Основы теории вероятностей
Репликаторные уравнения
Джон Мэйнард Смит в 1973 году ввёл понятие эволюционно-стабильной стратегии (ESS) для объяснения ритуализованных боёв у животных: почему олени в поединках используют рога, но редко убивают друг друга? Ответ - не сострадание, а эволюционное равновесие. В популяции страусов с 10 000 особей Hawks и Doves поддерживают строго определённые доли, предсказанные моделью.
Что описывает репликаторное уравнение dx_i/dt = x_i * (f_i(x) - bar_f(x))?
Репликаторное уравнение (Taylor-Jonker, 1978) моделирует селекцию: доля стратегии x_i растёт пропорционально тому, насколько её приспособленность f_i(x) выше средней bar_f(x) = sum_j x_j f_j(x). Это детерминированный предел стохастической эволюции при N → inf.
Эволюционно стабильные стратегии (ESS)
Игра Hawk-Dove моделирует конфликт за ресурс. Hawk - всегда сражаться; Dove - отступить при встрече с Hawk, разделить ресурс с другим Dove. При V > C Hawks доминируют (выгоднее всегда сражаться); при V < C возникает смешанное ESS с долей Hawks p* = V/C.
Какому условию удовлетворяет эволюционно стабильная стратегия x*?
Maynard Smith & Price (1973): ESS x* - стратегия, против которой никакая мутантная стратегия x´ не может закрепиться в популяции. Формально: u(x*, x*) > u(x´, x*), или u(x*, x*) = u(x´, x*) и u(x*, x´) > u(x´, x´). ESS - подмножество равновесий Нэша.
Применения: hawk-dove, кооперация, машинное обучение
ESS применяется за пределами биологии: в сетевых протоколах (TCP congestion control реализует репликаторную динамику), в поведенческой экономике (ограниченная рациональность как аппроксимация ESS-динамики) и в языковой эволюции (Nowak, Komarova 2001).
Связь между ESS и концепциями классической теории игр: ESS => NE (первое условие - это условие Нэша). Строгое NE => ESS (строгость гарантирует второе условие). Смешанное NE может быть ESS (при выполнении второго условия) или нет.
В игре hawk-dove какая стратегия является ESS при V < C (стоимость ранения превышает приз)?
В классической игре Maynard Smith о борьбе за ресурс ценности V с риском ранения C: при V < C ни чистая hawk, ни чистая dove не ESS. Смешанная p = V/C стабильна: при p > V/C доходы hawk падают, при p < V/C - растут. Это объясняет наблюдаемое распределение агрессии в популяциях животных.
Связи с другими областями
Эволюционная теория игр соединяет математическую биологию, экономику и теорию обучения.
- Повторяющиеся игры и народная теорема — Эволюционная динамика выбирает среди равновесий, которые народная теорема допускает
- Эволюционная теория игр — Базовый курс по эволюционным стабильным стратегиям и репликаторной динамике
- Теория игр в ML — Мультиагентные системы и GAN-обучение моделируются репликаторной динамикой
Итоги
- ESS: sigma* эволюционно стабильна, если мутант не может вторгнуться; влечёт NE, но не наоборот
- Репликаторная динамика: dx_i/dt = x_i*(f_i - f_bar); стратегии с приспособленностью выше средней растут в частоте
- Hawk-Dove: ESS доля Hawks = V/C при V < C; при нарушении баланса система возвращается к p*
- Фундаментальная теорема: средняя приспособленность f_bar монотонно растёт вдоль траекторий репликатора
- Применения: биология (бои, соотношение полов), сети (TCP), поведенческая экономика, языковая эволюция
Вопросы для размышления
- Почему каждая ESS является равновесием Нэша, но не каждое NE является ESS?
- Как репликаторная динамика связана с алгоритмами обучения с подкреплением в многоагентных системах?
- Почему половое соотношение 1:1 является ESS в большинстве популяций, даже когда самок явно «нужно» больше?