Теория игр

Байесовские игры и неполная информация

Аукционы Google и Facebook - это байесовские игры. Каждую секунду ~100 000 sealed-bid аукционов с частными оценками. Рекламодатели знают сколько им стоит клик, конкуренты - нет. $200M в день ставок - и оптимальная стратегия вычислена через BNE: ставить ровно (n-1)/n от истинной оценки.

**Google Ads (GSP auction):** ~100K аукционов в секунду. Равновесная ставка зависит от убеждений о распределении оценок конкурентов. Revenue Equivalence: теоретически Google мог бы использовать любой стандартный формат.
**Adverse selection в медицине:** ACA (Obamacare) обязала принимать all comers - сознательное нарушение BNE для достижения социального оптимума.
**Credit scoring:** FICO score, банковские андеррайтинговые модели - алгоритмы снижения adverse selection через уточнение типа заёмщика.

Предварительные знания

Аукционы Google: $200M ставок в день

Каждый раз при загрузке страницы Google проводит sealed-bid аукцион за рекламное место. ~8.5 миллиарда загрузок в день. Каждый рекламодатель знает сколько ему стоит клик - но не знает оценки конкурентов. Это классическая байесовская игра с частными оценками.

Неполная информация (incomplete information) отличается от несовершенной. **Несовершенная** (imperfect): игроки не видят некоторые **ходы** в текущей игре (карты в покере). **Неполная**: игроки не знают фундаментальные **характеристики** соперника - тип (type): предпочтения, оценки, издержки.

**Почему рынок подержанных авто не схлопнулся полностью (как в модели Акерлофа)?** Три механизма: 1) сигналинг (гарантии продавца, история обслуживания), 2) скрининг (независимая проверка у механика), 3) репутационные механизмы (CarHistory, CARFAX). Неполная информация разрушает рынки - но рынки изобретают инструменты борьбы.

Продавец подержанного авто знает его качество q, покупатель не знает. Почему это 'неполная', а не 'несовершенная' информация? Как трансформация Харшани моделирует эту ситуацию?

Неполная информация касается параметров (типов) игроков - неизвестных до начала игры. Несовершенная - о ходах в процессе игры. Трансформация Харшани вводит 'ход Природы' в начале, превращая неизвестный тип в случайный выбор, наблюдаемый одним игроком.

Байесовская игра: формальная модель

Байесовская игра (Bayesian game) - формальное описание игры с неполной информацией. Ключевое отличие от обычной игры: стратегия - не одно действие, а **функция от типа** (contingency plan для всех возможных типов).

**Revenue Equivalence Theorem:** при симметричных рисковых нейтральных участниках с независимыми оценками все стандартные форматы аукционов (первой цены, второй цены, английский, голландский) дают одинаковую ожидаемую выручку продавцу. Это одна из самых удивительных теорем аукционной теории.

В аукционе первой цены BNE стратегия - bid(v) = v/2. Почему игрок не ставит свою истинную оценку v? Выведите качественно оптимальное занижение ставки.

В аукционе первой цены BNE определяется балансом между выгодой от победы (v-b) и вероятностью победы P(win) = b для Uniform[0,1]. Ожидаемая выгода b(v-b) максимизируется при b=v/2. Занижение ставки необходимо для получения положительной прибыли при победе.

BNE и теорема о Revenue Equivalence

Равновесие Байеса-Нэша (BNE) - обобщение равновесия Нэша. Каждый тип каждого игрока максимизирует ожидаемую выплату, данные стратегии других и убеждения о типах.

**Google использует модифицированный Generalized Second-Price (GSP) аукцион**, а не чистый Vickrey. GSP не имеет доминирующей стратегии - равновесие зависит от убеждений о других. Точный BNE GSP - открытая исследовательская задача с прямым применением на $200M в день.

Аукцион Викри (второй цены) имеет простую доминирующую стратегию: ставить истинную оценку. Почему тогда Google не использует аукцион Викри вместо своего GSP?

Для аукционов с несколькими позициями теорема Викри расширяется до VCG-механизма, который значительно сложнее в реализации и понимании. GSP (Generalized Second Price) проще, уже интегрирован в рекламные системы, и его стратегические свойства сложнее эксплуатировать через координацию.

Adverse Selection и Moral Hazard

Неполная информация порождает два классических провала рынка. **Adverse selection** (до контракта): плохие типы вытесняют хорошие. **Moral hazard** (после контракта): застрахованный ведёт себя безответственнее.

**Moral hazard:** банк даёт кредит - заёмщик знает, что в случае банкротства потеряет меньше банка (limited liability). Incentive to take risk: приватизация прибыли при публичных убытках. Решение: loan covenants, залог, monitoring. Вся структура банковского регулирования построена вокруг moral hazard.

**Too Big to Fail как extreme moral hazard:** банки знали, что государство их спасёт в 2008. Это создало incentive к чрезмерному риску. Акерлоф, Спенс и Стиглиц получили Нобелевскую премию (2001) именно за анализ рынков с асимметричной информацией.

Страховой рынок при adverse selection приходит к 'death spiral'. Почему деление на группы риска (health risk assessment) восстанавливает эффективность рынка, и какие этические проблемы это создаёт?

Risk pooling с однородными группами устраняет adverse selection: каждый платит пропорционально своему риску E[claimᵢ], нет стимула для отбора против страховщика. Этическая цена - высокорисковые группы (больные, пожилые) вынуждены платить больше или исключаются из рынка.

Ключевые идеи

**Неполная информация**: игроки не знают типы (θᵢ) соперников. Харшани: Природа случайно назначает типы.
**BNE**: s*ᵢ(θᵢ) = лучший ответ для каждого типа θᵢ с учётом убеждений p(θ₋ᵢ|θᵢ) и стратегий других.
**First-price аукцион**: BNE bid(v) = v·(n-1)/n. Second-price (Vickrey): bid(v) = v (доминирующая стратегия).
**Revenue Equivalence**: все стандартные форматы дают одинаковую E[revenue] при симметричных rn-игроках с iid оценками.
**Adverse selection**: до контракта (плохие типы вытесняют хорошие). **Moral hazard**: после контракта (изменение поведения).

Связанные темы

Байесовские игры - основа аукционной теории и mechanism design:

Сигнальные игры — Сигналинг - способ раскрыть тип через costly action. Прямое продолжение байесовских игр с динамическим обновлением убеждений.
Повторяющиеся игры — Репутационные механизмы в повторяющихся играх решают adverse selection через сигналинг типа через историю действий

Вопросы для размышления

Google использует GSP вместо теоретически оптимального VCG (Vickrey-Clarke-Groves). Revenue Equivalence говорит, что они должны давать одинаковую выручку. Какие нарушения предположений Revenue Equivalence объясняют, почему Google выбирает GSP?
Adverse selection в страховании создаёт death spiral. Как обязательное страхование (как в автогражданской ответственности) математически изменяет BNE и устраняет adverse selection? Какие новые искажения оно создаёт?
ML алгоритмы для кредитного скоринга (LightGBM, нейросети) точнее предсказывают риск дефолта. С точки зрения теории игр: как улучшение информации о типе заёмщика изменяет равновесие на кредитном рынке?

Связанные уроки

stat-11-bayesian