Теория вероятностей
Математическое ожидание
Цели урока
- Понять смысл математического ожидания как "долгосрочного среднего"
- Научиться вычислять E[X] для дискретных и непрерывных СВ
- Освоить ключевое свойство: линейность E[X + Y] = E[X] + E[Y]
- Применять матожидание для принятия решений
- Понять ограничения - когда E[X] "врёт"
Предварительные знания
- Случайные величины - дискретные и непрерывные
- Базовые интегралы (для непрерывных СВ)
Казино предлагает игру: бросаете кубик, получаете $10 за каждое очко. Какова справедливая цена участия? Интуиция говорит - нужно найти "среднее". Матожидание - это то самое среднее, вычисленное математически строго.
- **Казино:** Почему заведение всегда в плюсе (отрицательное E[X] для игрока)
- **Инвестиции:** Ожидаемая доходность портфеля
- **Страхование:** Расчёт премий и выплат
- **Gamedev:** Баланс лута, drop rate, средний урон
- **ML:** Функция потерь = E[ошибки]
- **A/B тесты:** Средний эффект от изменения
Справедливая цена азартной игры
Всё началось с переписки двух гениев - Блеза Паскаля и Пьера Ферма в 1654 году. Их интересовал вопрос: **какова "справедливая" цена участия в азартной игре?** Ответ - математическое ожидание выигрыша. Если E[выигрыш] > цена билета - играть выгодно. Если меньше - невыгодно. Но в 1738 году Даниил Бернулли показал знаменитым Санкт-Петербургским парадоксом, что одного E[X] недостаточно. Это привело к созданию **теории полезности** и современной экономики.
Математическое ожидание
**1738 год, Санкт-Петербург.** Швейцарский математик Даниил Бернулли предлагает задачу, которая 300 лет не даёт покоя экономистам и философам.
**Игра:** Подбрасываем монету, пока не выпадет решка. Если решка на $n$-м броске - получаете $2^n$ рублей. Какова **справедливая цена** участия?
Первая решка? $2. Вторая? $4. Третья? $8. Десятая? $1024. Двадцатая? **Больше миллиона.**
Давайте посчитаем **ожидаемый выигрыш**... и получим **бесконечность**. Математика говорит: справедливая цена - любая сумма, даже миллиард! Но разумно ли отдать за эту игру хотя бы $100?
Сегодня мы разберём **математическое ожидание** - инструмент, который обычно работает блестяще... но иногда ломает интуицию.
Математическое ожидание $\mathbb{E}[X]$ дискретной случайной величины - это:
$\mathbb{E}[X]$ - взвешенная сумма, веса - вероятности. Это 'долгосрочное среднее' при множестве повторений. Для непрерывной величины: $\mathbb{E}[X]=\int x f(x)dx$.
Что такое математическое ожидание?
Что такое математическое ожидание?
**Математическое ожидание** (среднее, mean, expectation) - это **взвешенное среднее** всех значений СВ, где весами служат вероятности.
**Для дискретной СВ:**
**Для непрерывной СВ с плотностью $f(x)$:**
Пусть распределение вероятностей - это масса, размазанная по числовой прямой. $E[X]$ - это точка, где эта масса **балансирует**. Центр тяжести. Если провести много-много экспериментов и усреднить результаты, получится число, близкое к $E[X]$. Это **закон больших чисел**.
Среднее число очков на кубике
Классический пример
$X$ - число очков на честном кубике. $$E[X] = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + 3 \cdot \frac{1}{6} + 4 \cdot \frac{1}{6} + 5 \cdot \frac{1}{6} + 6 \cdot \frac{1}{6}$$ $$= \frac{1+2+3+4+5+6}{6} = \frac{21}{6} = 3.5$$ **Заметь:** 3.5 - **не** возможное значение кубика! Но если бросить 1000 раз и усреднить - получится число около 3.5.
Лотерея: с вероятностью 0.001 выигрыш $1000, иначе $0. Какова "справедливая" цена билета?
$E[\text{выигрыш}] = 1000 \cdot 0.001 + 0 \cdot 0.999 = 1$ **Справедливая цена = $1.** Если билет стоит меньше - выгодно покупать. Если больше - лотерея в плюсе. Реальные лотереи продают билеты дороже E[X] - иначе как бы они зарабатывали?
Свойства математического ожидания
Свойства математического ожидания
$$E[aX + b] = a \cdot E[X] + b$$ $$E[X + Y] = E[X] + E[Y]$$ **Второе работает ВСЕГДА** - даже для зависимых СВ! Это невероятно мощно: можно считать E[X + Y], не зная совместного распределения.
Сумма двух кубиков
Линейность в действии
$X_1, X_2$ - очки на первом и втором кубике. $E[X_1] = E[X_2] = 3.5$ $$E[X_1 + X_2] = E[X_1] + E[X_2] = 3.5 + 3.5 = 7$$ **Средняя сумма = 7.** Вот почему 7 - самое "популярное" число в настольных играх и крэпсе! Заметь: мы не считали все 36 комбинаций - линейность сделала всё за нас.
Равномерное распределение
$X \sim U(a, b)$
Автобус приходит равномерно на интервале $[a, b]$. $$E[X] = \int_a^b x \cdot \frac{1}{b-a}\,dx = \frac{1}{b-a} \cdot \frac{x^2}{2}\Big|_a^b$$ $$= \frac{b^2 - a^2}{2(b-a)} = \frac{(b-a)(b+a)}{2(b-a)} = \frac{a+b}{2}$$ **Середина интервала!** Интуитивно понятно: все точки равновероятны, значит среднее - посередине.
X и Y - две СВ (возможно, зависимые). E[X] = 5, E[Y] = 3. Чему равно E[2X - Y + 10]?
По линейности: $$E[2X - Y + 10] = 2 \cdot E[X] - E[Y] + 10 = 2 \cdot 5 - 3 + 10 = 17$$ **Линейность работает ВСЕГДА** - независимо от того, зависимы X и Y или нет. Это не работает для $E[X \cdot Y]$ - там нужна независимость!
Применение: почему казино всегда в плюсе
Применение: почему казино всегда в плюсе
Американская рулетка
Ставка на красное
Ставка $1 на красное. • Красное (18/38): выигрыш $1 • Не красное (20/38): проигрыш $1 $$E[\text{прибыль}] = 1 \cdot \frac{18}{38} + (-1) \cdot \frac{20}{38} = \frac{18-20}{38} = -\frac{2}{38}$$ $$\approx -5.26\text{ центов с каждого доллара}$$ **Казино забирает ~5.3%** с каждой ставки. Если играть долго - **гарантированно** проиграешь. На миллионе ставок по $1: казино заработает ~52,600.
$E[X] = 3.5$ для кубика не значит, что выпадет 3.5. $E[X]$ - это **среднее по множеству** повторений. Для одной игры результат может быть любым! **Закон больших чисел:** чем больше повторений, тем ближе среднее к $E[X]$.
Страховка: когда "невыгодно" = "разумно"
E[X] - не единственный критерий
Страховка телефона: $100/год. Вероятность поломки: 5%. Ремонт: $500. $E[\text{без страховки}] = 500 \cdot 0.05 = 25$ $E[\text{со страховкой}] = 100$ (премия) **Математически** страховка невыгодна ($100 > $25). **Но!** Страховка убирает **риск**. Для многих людей стабильные -$100 лучше, чем шанс потерять -$500. Об этом - в теме про дисперсию и теорию полезности.
Игра: подбрасываете монету. Орёл - получаете $10, решка - платите $6. E[прибыль] = ?
$E[\text{прибыль}] = 10 \cdot 0.5 + (-6) \cdot 0.5 = 5 - 3 = 2$ **Ожидаемая прибыль = $2 > 0.** Играть **выгодно** (в долгосрочной перспективе). Если сыграть 1000 раз - в среднем выиграете ~$2000.
🃏 Разгадка Санкт-Петербургского парадокса
🃏 Разгадка Санкт-Петербургского парадокса
Вернёмся к игре из начала. Решка на $n$-м броске → выигрыш $2^n$.
**Ожидаемый выигрыш = ∞!** Но никто не заплатит даже $100 за эту игру. Почему?
**1. Бесконечный капитал казино** Чтобы выплатить $2^{30}$ (больше миллиарда), казино должно иметь миллиарды. На практике - нет. **2. Убывающая полезность** $1 миллион для бедняка - счастье. Ещё $1 миллион для миллиардера - мелочь. Полезность денег растёт медленнее, чем сумма. **3. Время жизни** Чтобы "заработать" на этой игре, нужно сыграть миллионы раз. Человеческая жизнь конечна.
**Вывод:** $E[X]$ - мощный инструмент, но не единственный критерий. Нужно учитывать **дисперсию**, **полезность**, **ограничения реального мира**.
Если ограничить игру (казино платит максимум $1,000,000), чему равно E[X]?
При ограничении $1M: максимум ~20 бросков. $E[X] = \sum_{n=1}^{20} 1 = 20$ Добавляя хвост распределения с ограниченной выплатой, получаем E[X] ≈ $20-21. **Разумная цена игры: ~$20.** Теперь парадокса нет!
Практика
Практика
СВ X: P(X = -2) = 0.3, P(X = 1) = 0.5, P(X = 4) = 0.2. Найдите E[X] и E[3X - 1].
$E[X] = (-2) \cdot 0.3 + 1 \cdot 0.5 + 4 \cdot 0.2$ $= -0.6 + 0.5 + 0.8 = 0.7$ $E[3X - 1] = 3 \cdot 0.7 - 1 = 2.1 - 1 = 1.1$
Плотность СВ: f(x) = 2x при 0 ≤ x ≤ 1, иначе 0. Найдите E[X].
$E[X] = \int_0^1 x \cdot 2x\,dx = \int_0^1 2x^2\,dx$ $= \frac{2x^3}{3}\Big|_0^1 = \frac{2}{3}$ Среднее = 2/3, ближе к 1, чем к 0 - потому что плотность растёт с x.
В коробке 5 белых и 3 чёрных шара. Вынимают 2 шара (без возвращения). X = число белых. Найдите E[X].
**Способ 1 (комбинаторика):** $P(X=0) = C_3^2/C_8^2 = 3/28$ $P(X=1) = C_5^1 C_3^1/C_8^2 = 15/28$ $P(X=2) = C_5^2/C_8^2 = 10/28$ $E[X] = 0 \cdot 3/28 + 1 \cdot 15/28 + 2 \cdot 10/28 = 35/28 = 5/4$ **Способ 2 (линейность):** $X = X_1 + X_2$, где $X_i$ = индикатор "i-й шар белый" $E[X_1] = P(\text{1-й белый}) = 5/8$ $E[X_2] = P(\text{2-й белый}) = 5/8$ (по симметрии!) $E[X] = 5/8 + 5/8 = 10/8 = 5/4 = 1.25$
E[X·Y] = E[X]·E[Y] всегда
E[X·Y] = E[X]·E[Y] ТОЛЬКО для независимых X и Y
Для зависимых СВ это **неверно**! Пример: $X$ - число на кубике, $Y = X$ (одно и то же). $E[X] = E[Y] = 3.5$ $E[X \cdot Y] = E[X^2] = (1+4+9+16+25+36)/6 = 91/6 \approx 15.17$ Но $E[X] \cdot E[Y] = 3.5 \cdot 3.5 = 12.25 \neq 15.17$ Зависимость меняет всё!
X и Y независимы. E[X] = 2, E[Y] = 3, E[X²] = 5, E[Y²] = 10. Чему равно E[XY]?
Для **независимых** СВ: $E[XY] = E[X] \cdot E[Y] = 2 \cdot 3 = 6$ Информация о $E[X^2]$ и $E[Y^2]$ здесь не нужна - она пригодится для дисперсии!
E[X] - центр тяжести распределения
Математическое ожидание - отправная точка для всей статистики.
- Дисперсия — Мера "разброса" вокруг E[X] - следующий урок!
- Закон больших чисел — Среднее выборки → E[X] при n → ∞
- Функция потерь в ML — Минимизация E[loss] - суть обучения
- Теория игр — Ожидаемый выигрыш определяет стратегию
Ключевые идеи
- **Дискретная СВ:** $E[X] = \sum x_i \cdot p_i$
- **Непрерывная СВ:** $E[X] = \int x \cdot f(x)\,dx$
- **Линейность:** $E[aX + b] = aE[X] + b$, $E[X+Y] = E[X] + E[Y]$ (всегда!)
- **E[XY] = E[X]·E[Y]** только для независимых СВ
- **Интерпретация:** "долгосрочное среднее" при повторении эксперимента
- **Ограничения:** Санкт-Петербургский парадокс - E[X] не всё!
Вопросы для размышления
- 🃏 Вернёмся к парадоксу: какова справедливая цена Санкт-Петербургской игры? Почему именно столько?
- Если E[X] < 0 для всех игр в казино - почему люди всё равно играют?
- Когда решения на основе E[X] могут быть катастрофически неверными?
- Почему в ML минимизируют E[loss], а не max(loss)?