Теория вероятностей

Математическое ожидание

Цели урока

  • Понять смысл математического ожидания как "долгосрочного среднего"
  • Научиться вычислять E[X] для дискретных и непрерывных СВ
  • Освоить ключевое свойство: линейность E[X + Y] = E[X] + E[Y]
  • Применять матожидание для принятия решений
  • Понять ограничения - когда E[X] "врёт"

Предварительные знания

  • Случайные величины - дискретные и непрерывные
  • Базовые интегралы (для непрерывных СВ)
  • Random Variables
  • Sequences: How Infinity Converges

Казино предлагает игру: бросаете кубик, получаете $10 за каждое очко. Какова справедливая цена участия? Интуиция говорит - нужно найти "среднее". Матожидание - это то самое среднее, вычисленное математически строго.

  • **Казино:** Почему заведение всегда в плюсе (отрицательное E[X] для игрока)
  • **Инвестиции:** Ожидаемая доходность портфеля
  • **Страхование:** Расчёт премий и выплат
  • **Gamedev:** Баланс лута, drop rate, средний урон
  • **ML:** Функция потерь = E[ошибки]
  • **A/B тесты:** Средний эффект от изменения

Справедливая цена азартной игры

Всё началось с переписки двух гениев - Блеза Паскаля и Пьера Ферма в 1654 году. Их интересовал вопрос: **какова "справедливая" цена участия в азартной игре?** Ответ - математическое ожидание выигрыша. Если E[выигрыш] > цена билета - играть выгодно. Если меньше - невыгодно. Но в 1738 году Даниил Бернулли показал знаменитым Санкт-Петербургским парадоксом, что одного E[X] недостаточно. Это привело к созданию **теории полезности** и современной экономики.

Математическое ожидание

**1738 год, Санкт-Петербург.** Швейцарский математик Даниил Бернулли предлагает задачу, которая 300 лет не даёт покоя экономистам и философам.

**Игра:** Подбрасываем монету, пока не выпадет решка. Если решка на $n$-м броске - получаете $2^n$ рублей. Какова **справедливая цена** участия?

Первая решка? $2. Вторая? $4. Третья? $8. Десятая? $1024. Двадцатая? **Больше миллиона.**

Давайте посчитаем **ожидаемый выигрыш**... и получим **бесконечность**. Математика говорит: справедливая цена - любая сумма, даже миллиард! Но разумно ли отдать за эту игру хотя бы $100?

Сегодня мы разберём **математическое ожидание** - инструмент, который обычно работает блестяще... но иногда ломает интуицию.

Математическое ожидание $\mathbb{E}[X]$ дискретной случайной величины - это:

$\mathbb{E}[X]$ - взвешенная сумма, веса - вероятности. Это 'долгосрочное среднее' при множестве повторений. Для непрерывной величины: $\mathbb{E}[X]=\int x f(x)dx$.

Что такое математическое ожидание?

Что такое математическое ожидание?

**Математическое ожидание** (среднее, mean, expectation) - это **взвешенное среднее** всех значений СВ, где весами служат вероятности.

**Для дискретной СВ:**

**Для непрерывной СВ с плотностью $f(x)$:**

Пусть распределение вероятностей - это масса, размазанная по числовой прямой. $E[X]$ - это точка, где эта масса **балансирует**. Центр тяжести. Если провести много-много экспериментов и усреднить результаты, получится число, близкое к $E[X]$. Это **закон больших чисел**.

Среднее число очков на кубике

Классический пример

$X$ - число очков на честном кубике. $$E[X] = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + 3 \cdot \frac{1}{6} + 4 \cdot \frac{1}{6} + 5 \cdot \frac{1}{6} + 6 \cdot \frac{1}{6}$$ $$= \frac{1+2+3+4+5+6}{6} = \frac{21}{6} = 3.5$$ **Заметь:** 3.5 - **не** возможное значение кубика! Но если бросить 1000 раз и усреднить - получится число около 3.5.

Лотерея: с вероятностью 0.001 выигрыш $1000, иначе $0. Какова "справедливая" цена билета?

$E[\text{выигрыш}] = 1000 \cdot 0.001 + 0 \cdot 0.999 = 1$ **Справедливая цена = $1.** Если билет стоит меньше - выгодно покупать. Если больше - лотерея в плюсе. Реальные лотереи продают билеты дороже E[X] - иначе как бы они зарабатывали?

Свойства математического ожидания

Свойства математического ожидания

$$E[aX + b] = a \cdot E[X] + b$$ $$E[X + Y] = E[X] + E[Y]$$ **Второе работает ВСЕГДА** - даже для зависимых СВ! Это невероятно мощно: можно считать E[X + Y], не зная совместного распределения.

Сумма двух кубиков

Линейность в действии

$X_1, X_2$ - очки на первом и втором кубике. $E[X_1] = E[X_2] = 3.5$ $$E[X_1 + X_2] = E[X_1] + E[X_2] = 3.5 + 3.5 = 7$$ **Средняя сумма = 7.** Вот почему 7 - самое "популярное" число в настольных играх и крэпсе! Заметь: мы не считали все 36 комбинаций - линейность сделала всё за нас.

Равномерное распределение

$X \sim U(a, b)$

Автобус приходит равномерно на интервале $[a, b]$. $$E[X] = \int_a^b x \cdot \frac{1}{b-a}\,dx = \frac{1}{b-a} \cdot \frac{x^2}{2}\Big|_a^b$$ $$= \frac{b^2 - a^2}{2(b-a)} = \frac{(b-a)(b+a)}{2(b-a)} = \frac{a+b}{2}$$ **Середина интервала!** Интуитивно понятно: все точки равновероятны, значит среднее - посередине.

X и Y - две СВ (возможно, зависимые). E[X] = 5, E[Y] = 3. Чему равно E[2X - Y + 10]?

По линейности: $$E[2X - Y + 10] = 2 \cdot E[X] - E[Y] + 10 = 2 \cdot 5 - 3 + 10 = 17$$ **Линейность работает ВСЕГДА** - независимо от того, зависимы X и Y или нет. Это не работает для $E[X \cdot Y]$ - там нужна независимость!

Применение: почему казино всегда в плюсе

Применение: почему казино всегда в плюсе

Американская рулетка

Ставка на красное

Ставка $1 на красное. • Красное (18/38): выигрыш $1 • Не красное (20/38): проигрыш $1 $$E[\text{прибыль}] = 1 \cdot \frac{18}{38} + (-1) \cdot \frac{20}{38} = \frac{18-20}{38} = -\frac{2}{38}$$ $$\approx -5.26\text{ центов с каждого доллара}$$ **Казино забирает ~5.3%** с каждой ставки. Если играть долго - **гарантированно** проиграешь. На миллионе ставок по $1: казино заработает ~52,600.

$E[X] = 3.5$ для кубика не значит, что выпадет 3.5. $E[X]$ - это **среднее по множеству** повторений. Для одной игры результат может быть любым! **Закон больших чисел:** чем больше повторений, тем ближе среднее к $E[X]$.

Страховка: когда "невыгодно" = "разумно"

E[X] - не единственный критерий

Страховка телефона: $100/год. Вероятность поломки: 5%. Ремонт: $500. $E[\text{без страховки}] = 500 \cdot 0.05 = 25$ $E[\text{со страховкой}] = 100$ (премия) **Математически** страховка невыгодна ($100 > $25). **Но!** Страховка убирает **риск**. Для многих людей стабильные -$100 лучше, чем шанс потерять -$500. Об этом - в теме про дисперсию и теорию полезности.

Игра: подбрасываете монету. Орёл - получаете $10, решка - платите $6. E[прибыль] = ?

$E[\text{прибыль}] = 10 \cdot 0.5 + (-6) \cdot 0.5 = 5 - 3 = 2$ **Ожидаемая прибыль = $2 > 0.** Играть **выгодно** (в долгосрочной перспективе). Если сыграть 1000 раз - в среднем выиграете ~$2000.

🃏 Разгадка Санкт-Петербургского парадокса

🃏 Разгадка Санкт-Петербургского парадокса

Вернёмся к игре из начала. Решка на $n$-м броске → выигрыш $2^n$.

**Ожидаемый выигрыш = ∞!** Но никто не заплатит даже $100 за эту игру. Почему?

**1. Бесконечный капитал казино** Чтобы выплатить $2^{30}$ (больше миллиарда), казино должно иметь миллиарды. На практике - нет. **2. Убывающая полезность** $1 миллион для бедняка - счастье. Ещё $1 миллион для миллиардера - мелочь. Полезность денег растёт медленнее, чем сумма. **3. Время жизни** Чтобы "заработать" на этой игре, нужно сыграть миллионы раз. Человеческая жизнь конечна.

**Вывод:** $E[X]$ - мощный инструмент, но не единственный критерий. Нужно учитывать **дисперсию**, **полезность**, **ограничения реального мира**.

Если ограничить игру (казино платит максимум $1,000,000), чему равно E[X]?

При ограничении $1M: максимум ~20 бросков. $E[X] = \sum_{n=1}^{20} 1 = 20$ Добавляя хвост распределения с ограниченной выплатой, получаем E[X] ≈ $20-21. **Разумная цена игры: ~$20.** Теперь парадокса нет!

Практика

Практика

СВ X: P(X = -2) = 0.3, P(X = 1) = 0.5, P(X = 4) = 0.2. Найдите E[X] и E[3X - 1].

$E[X] = (-2) \cdot 0.3 + 1 \cdot 0.5 + 4 \cdot 0.2$ $= -0.6 + 0.5 + 0.8 = 0.7$ $E[3X - 1] = 3 \cdot 0.7 - 1 = 2.1 - 1 = 1.1$

Плотность СВ: f(x) = 2x при 0 ≤ x ≤ 1, иначе 0. Найдите E[X].

$E[X] = \int_0^1 x \cdot 2x\,dx = \int_0^1 2x^2\,dx$ $= \frac{2x^3}{3}\Big|_0^1 = \frac{2}{3}$ Среднее = 2/3, ближе к 1, чем к 0 - потому что плотность растёт с x.

В коробке 5 белых и 3 чёрных шара. Вынимают 2 шара (без возвращения). X = число белых. Найдите E[X].

**Способ 1 (комбинаторика):** $P(X=0) = C_3^2/C_8^2 = 3/28$ $P(X=1) = C_5^1 C_3^1/C_8^2 = 15/28$ $P(X=2) = C_5^2/C_8^2 = 10/28$ $E[X] = 0 \cdot 3/28 + 1 \cdot 15/28 + 2 \cdot 10/28 = 35/28 = 5/4$ **Способ 2 (линейность):** $X = X_1 + X_2$, где $X_i$ = индикатор "i-й шар белый" $E[X_1] = P(\text{1-й белый}) = 5/8$ $E[X_2] = P(\text{2-й белый}) = 5/8$ (по симметрии!) $E[X] = 5/8 + 5/8 = 10/8 = 5/4 = 1.25$

E[X·Y] = E[X]·E[Y] всегда

E[X·Y] = E[X]·E[Y] ТОЛЬКО для независимых X и Y

Для зависимых СВ это **неверно**! Пример: $X$ - число на кубике, $Y = X$ (одно и то же). $E[X] = E[Y] = 3.5$ $E[X \cdot Y] = E[X^2] = (1+4+9+16+25+36)/6 = 91/6 \approx 15.17$ Но $E[X] \cdot E[Y] = 3.5 \cdot 3.5 = 12.25 \neq 15.17$ Зависимость меняет всё!

X и Y независимы. E[X] = 2, E[Y] = 3, E[X²] = 5, E[Y²] = 10. Чему равно E[XY]?

Для **независимых** СВ: $E[XY] = E[X] \cdot E[Y] = 2 \cdot 3 = 6$ Информация о $E[X^2]$ и $E[Y^2]$ здесь не нужна - она пригодится для дисперсии!

E[X] - центр тяжести распределения

Математическое ожидание - отправная точка для всей статистики.

  • Дисперсия — Мера "разброса" вокруг E[X] - следующий урок!
  • Закон больших чисел — Среднее выборки → E[X] при n → ∞
  • Функция потерь в ML — Минимизация E[loss] - суть обучения
  • Теория игр — Ожидаемый выигрыш определяет стратегию

Ключевые идеи

  • **Дискретная СВ:** $E[X] = \sum x_i \cdot p_i$
  • **Непрерывная СВ:** $E[X] = \int x \cdot f(x)\,dx$
  • **Линейность:** $E[aX + b] = aE[X] + b$, $E[X+Y] = E[X] + E[Y]$ (всегда!)
  • **E[XY] = E[X]·E[Y]** только для независимых СВ
  • **Интерпретация:** "долгосрочное среднее" при повторении эксперимента
  • **Ограничения:** Санкт-Петербургский парадокс - E[X] не всё!

Вопросы для размышления

  • 🃏 Вернёмся к парадоксу: какова справедливая цена Санкт-Петербургской игры? Почему именно столько?
  • Если E[X] < 0 для всех игр в казино - почему люди всё равно играют?
  • Когда решения на основе E[X] могут быть катастрофически неверными?
  • Почему в ML минимизируют E[loss], а не max(loss)?

Связанные уроки

  • calc-01-sequences
  • ml-09-gradient-descent
  • stat-02-estimation
Математическое ожидание

0

1

Войти