Теория игр
Кооперативные игры
Uber, Lyft и местное такси хотят объединиться для сокращения пробок. Три страны совместно финансируют спутник. Юридическая фирма принимает нового партнёра. Во всех случаях вопрос один: как справедливо поделить совместно созданную ценность? Кооперативная теория игр - математика справедливости, лежащая в основе SHAP, механизмов распределения ресурсов и теории альянсов.
- **SHAP (XAI):** значение Шепли - стандарт объяснимости ML-моделей в банках, медицине, юриспруденции. Каждый признак получает «свою долю» в предсказании
- **Деление затрат:** аэропорты, водоснабжение, телеком-сети - нуклеолус и значение Шепли используются для справедливого распределения инфраструктурных затрат
- **Matching markets:** алгоритм стабильных сопоставлений (Гейл-Шепли) определяет распределение студентов-медиков по больницам, детей по школам, органов по реципиентам
Предварительные знания
Коалиции и характеристическая функция
Три юриста открывают совместную фирму. Первый специализируется на налогах, второй - на корпоративном праве, третий - на патентах. Вместе они могут брать клиентов, которых ни один не мог бы обслужить в одиночку. Как делить прибыль? Кооперативная теория игр отвечает именно на этот вопрос: не как игроки стратегически взаимодействуют, а как они должны делить коллективный выигрыш.
Кооперативная игра - пара (N, v), где: • N = {1, 2, ..., n} - игроки • v: 2^N → R - характеристическая функция: v(S) = выигрыш коалиции S при оптимальной кооперации внутри v(∅) = 0, v обычно супераддитивна: v(S ∪ T) ≥ v(S) + v(T) при S ∩ T = ∅
Ключевой вопрос кооперативной теории: **как делить v(N) между игроками?** Требования к справедливому дележу: каждый игрок получает не меньше своего индивидуального выигрыша v({i}), каждая коалиция не имеет стимула покинуть большую коалицию. Это называется **ядром** (core).
Кооперативная теория игр: от фон Неймана к Шепли
Кооперативные игры появились в книге фон Неймана и Моргенштерна (1944). Ллойд Шепли в 1953 году предложил элегантное аксиоматическое решение - значение Шепли. В 2012 году Шепли получил Нобелевскую премию по экономике (вместе с Ротом) за работы по теории сопоставлений и кооперативных игр.
Кооперативные игры - это когда игроки договариваются и всегда помогают друг другу
Кооперативные игры моделируют возможность координации и делёж выигрыша. Вопрос не «помогать или нет», а «как справедливо разделить совместно созданную ценность».
Фокус кооперативных игр - на distribution of value, а не на процессе принятия решений. Это полезно для анализа слияний, альянсов, распределения прибыли.
Что такое характеристическая функция v(S) в кооперативной игре?
Значение Шепли
Допустим, игроки «входят» в коалицию по одному в случайном порядке. Каждый получает свой **предельный вклад** - насколько увеличивается выигрыш с его приходом. Значение Шепли - средний предельный вклад по всем возможным порядкам вхождения. Это единственный дележ, удовлетворяющий четырём «разумным» аксиомам.
φᵢ(v) = Σ_{S⊆N\{i}} [|S|!(|N|-|S|-1)! / |N|!] · [v(S∪{i}) - v(S)] Где v(S∪{i}) - v(S) - предельный вклад игрока i при присоединении к коалиции S. Аксиомы: эффективность (сумма φᵢ = v(N)), симметрия, нулевой игрок, аддитивность.
| Аксиома Шепли | Смысл |
|---|---|
| Эффективность | Сумма всех φᵢ = v(N): всё делится полностью |
| Симметрия | Если v(S∪{i}) = v(S∪{j}) для всех S, то φᵢ = φⱼ |
| Нулевой игрок | Если i не вносит вклад ни в одну коалицию, φᵢ = 0 |
| Аддитивность | φᵢ(v+w) = φᵢ(v) + φᵢ(w) для двух игр v и w |
Значение Шепли нашло применение в ML: SHAP (SHapley Additive exPlanations) - стандарт объяснимости моделей. Каждый признак получает «значение Шепли» - его средний предельный вклад в предсказание при всех возможных комбинациях признаков.
SHAP в машинном обучении - просто эвристика объяснения модели, не связанная с теорией игр
SHAP - прямое применение значения Шепли: признаки - игроки, предсказание модели - v(коалиция признаков). Все аксиомы Шепли выполняются.
Lundberg & Lee (2017) показали, что SHAP - единственная аддитивная функция объяснения, удовлетворяющая аксиомам Шепли. Это не эвристика, а теоретически обоснованный метод.
Значение Шепли игрока i - это:
Ядро (Core)
Дележ x = (x₁, ..., xₙ) «стабилен», если ни одна коалиция S не захочет отколоться. Точнее: если Σᵢ∈S xᵢ ≥ v(S) для каждой коалиции S - то у неё нет стимула уходить. Множество всех стабильных дележей называется ядром (core). Ядро может быть пустым - тогда «большая коалиция» нестабильна.
Дележ x ∈ Core если: 1. Σᵢ∈N xᵢ = v(N) - эффективность 2. Σᵢ∈S xᵢ ≥ v(S) для всех S ⊆ N - стабильность коалиций Ядро непусто ⟺ игра «сбалансирована» (теорема Бондарева-Шепли).
Ядро может быть пустым. Классический пример: «мажоритарные игры» (majority games), где любые двое могут победить одного. Нет дележа, который устраивает всех троих: одна пара всегда хочет переманить третьего. В этом случае нужны другие концепции решения - нуклеолус или value Шепли (которое всегда существует).
Ядро всегда существует в кооперативных играх
Ядро может быть пустым. В мажоритарных играх (любые двое побеждают одного) ядро пусто - нет стабильного дележа.
Отсутствие ядра - серьёзная проблема для стабильности больших коалиций. Именно поэтому нужны другие решающие концепции: нуклеолус (всегда существует в несобственных играх) или значение Шепли (всегда существует).
Дележ принадлежит ядру (core) кооперативной игры, если:
Нуклеолус
Когда ядро пусто, нужно другое решение. Нуклеолус - дележ, минимизирующий «максимальное недовольство» коалиций. Недовольство (excess) коалиции S - насколько она недополучает: e(S, x) = v(S) - Σᵢ∈S xᵢ. Нуклеолус лексикографически минимизирует вектор всех excess в убывающем порядке.
Для дележа x вектор excess: θ(x) = (e(S₁,x), ..., e(S_{2n},x)) - все коалиционные недовольства, отсортированные по убыванию. Нуклеолус: η = argmin_{x∈X} θ(x) - лексикографический минимум. Свойства: всегда единственен (в отличие от ядра), лежит в ядре если оно непусто, симметричен.
Нуклеолус используется в практических задачах распределения затрат: аэропортная игра (как делить стоимость взлётно-посадочной полосы между авиакомпаниями с разными типами самолётов), распределение затрат на водоснабжение между городами, дележ доходов в совместных предприятиях.
Кооперативная теория игр - только академическая математика без практических приложений
SHAP для объяснимости ML, распределение затрат в альянсах, дизайн механизмов распределения ресурсов - всё это прямые приложения кооперативной теории.
Значение Шепли стало стандартом XAI (explainable AI). Нуклеолус применяется в задачах cost allocation в логистике и телекоммуникациях. Теория сопоставлений (matching) - нобелевская работа Рота и Шепли - меняет медицинские рынки и школьные зачисления.
Чем нуклеолус отличается от ядра как концепция решения?
Ключевые идеи
- **Характеристическая функция v(S):** ценность коалиции S - базис кооперативной теории
- **Значение Шепли:** единственный дележ, удовлетворяющий 4 аксиомам справедливости - основа SHAP в ML
- **Ядро (Core):** стабильные дележи, при которых ни одна коалиция не хочет отколоться (может быть пустым)
- **Нуклеолус:** всегда единственен, минимизирует максимальное недовольство коалиций
Связанные темы
Кооперативные игры дополняют некооперативную теорию и лежат в основе механизмов:
- Дилемма заключённого — Кооперация в ДЗ - переход от некооперативного к кооперативному анализу
- Mechanism Design — Механизмы часто используют кооперативные концепции для дизайна систем с трансферами
- Теория игр в ML — SHAP - прямое применение значения Шепли в объяснимом AI
Вопросы для размышления
- В команде разработки один человек пишет 80% кода, другой делает архитектурные решения, третий общается с клиентами. Как распределить бонусы, используя логику значения Шепли?
- Ядро может быть пустым - нет стабильного дележа. Можете ли привести реальный пример (альянс, политическая коалиция), где это происходит? Как стороны справляются?
- SHAP объясняет предсказания ML через значение Шепли. Но вычисление точного Шепли - NP-hard для больших наборов признаков. Как работают на практике приближённые методы?