Теория вероятностей

Классические дискретные распределения

Цели урока

Освоить распределение Бернулли как базовый строительный блок
Понять биномиальное распределение и его применения
Разобраться, когда и почему возникает распределение Пуассона
Использовать геометрическое распределение для "времени ожидания"
Научиться выбирать правильное распределение для задачи

Предварительные знания

Случайные величины (дискретные и непрерывные)
Математическое ожидание E[X]
Дисперсия Var[X]

**1898 год.** Статистик Ладислав Борткевич изучает странные данные: сколько прусских кавалеристов погибло от удара копытом лошади за 20 лет в 14 корпусах армии. Событие кажется абсолютно случайным - как его предсказать? Оказывается, математика справляется. И не просто справляется - распределение Пуассона **идеально** описывает эти смерти.

A/B тесты: конверсия на сайте (биномиальное)
Колл-центры: число звонков в час (Пуассон)
Онлайн-игры: сколько попыток до редкого дропа (геометрическое)
Страхование: число аварий в год (Пуассон)
Генетика: число мутаций в ДНК (Пуассон)

Закон малых чисел

Французский математик вывел формулу для "редких событий", но сам не понимал её практического значения. Только 60 лет спустя Борткевич показал, что формула идеально описывает реальные данные - от смертей кавалеристов до числа изюминок в булочке. Сегодня распределение Пуассона - один из главных инструментов data science.

Классические дискретные распределения

Дискретные распределения принимают конечное или счётное число значений: число писем за час, количество выпавших шестёрок, число попыток до первого успеха. У каждой такой ситуации есть свой 'каноничный' закон распределения.

Четыре главных героя дискретной вероятности: **Бернулли** (один опыт с двумя исходами), **Биномиальное** (число успехов в $n$ опытах), **Пуассона** (редкие события за единицу времени), **Геометрическое** (число попыток до первого успеха). Каждое - модель реальной ситуации.

Многие 'разные' задачи сводятся к одному из этих четырёх распределений. Распознать его - значит сразу получить формулы для $\mathbb{E}$, $\text{Var}$ и хвостов. Это интеллектуальный шорткат, экономящий часы вычислений.

Какое распределение моделирует число успехов в $n$ независимых испытаниях Бернулли с вероятностью $p$?

Биномиальное распределение: $P(X=k)=\binom{n}{k}p^k(1-p)^{n-k}$. Бернулли - частный случай при $n=1$. Пуассон - предел при $n\to\infty, p\to 0, np=\lambda$.

1. Распределение Бернулли - атом вероятности

Всё начинается с **простейшего** случайного эксперимента: один опыт с двумя исходами.

Монета: орёл (1) или решка (0)
Клиент: купил (1) или ушёл (0)
Тест: сдал (1) или провалил (0)
Email: открыли (1) или нет (0)

где $p$ - вероятность "успеха" (единицы).

X	P(X)	Формула
0 (неудача)	q = 1-p	P(X=0) = 1-p
1 (успех)	p	P(X=1) = p

**Характеристики:** $E[X] = p$ - среднее равно вероятности успеха $Var[X] = p(1-p) = pq$ - максимум при $p = 0.5$

Почему дисперсия максимальна при $p = 0.5$? Это точка **максимальной неопределённости** - когда исходы равновероятны, мы "знаем" меньше всего о том, что выпадет.

Конверсия на сайте - 3%. Для одного посетителя X = 1 если купил. Чему равна Var[X]?

Для Бернулли Var[X] = p(1-p) = 0.03 × 0.97 = 0.0291. Заметьте: дисперсия близка к p при малых p (разброс небольшой, ведь почти всегда X = 0).

2. Биномиальное распределение - сумма Бернулли

Что если провести **n независимых** экспериментов Бернулли и посчитать число успехов?

Пусть $X_1, X_2, ..., X_n$ - независимые $Bernoulli(p)$. Тогда:

Вероятность получить **ровно k успехов** из n попыток:

Разберём формулу по частям:

$C_n^k$ - число способов выбрать, **какие** k опытов будут успешными
$p^k$ - вероятность, что эти k опытов успешны
$(1-p)^{n-k}$ - вероятность, что остальные n-k неуспешны

**Характеристики:** $E[X] = np$ - в среднем np успехов $Var[X] = np(1-p)$ - сумма дисперсий независимых Бернулли

A/B тест

Конверсия нового дизайна

На новый дизайн зашли 1000 посетителей. Конверсия (покупка) - 5%. $X$ = число покупок, $X \sim Binomial(1000, 0.05)$ $E[X] = 1000 \times 0.05 = 50$ покупок в среднем $\sigma = \sqrt{1000 \times 0.05 \times 0.95} = \sqrt{47.5} \approx 6.9$ С 95% вероятностью: от 50 - 14 = 36 до 50 + 14 = 64 покупок (по правилу 2σ для нормального приближения)

Честную монету подбросили 4 раза. Какова вероятность получить ровно 2 орла?

$P(X=2) = C_4^2 \times 0.5^2 \times 0.5^2 = 6 \times 0.0625 = 0.375$. Интересно: 2 орла из 4 - самый вероятный исход, но его вероятность всего 37.5%!

3. Распределение Пуассона - закон редких событий

Теперь к прусским кавалеристам! Распределение Пуассона описывает **число событий** за фиксированный период, когда:

События **редкие** (p мала)
События **независимые** (одно не влияет на другое)
Событие может произойти в **любой момент** с одинаковой скоростью

где $\lambda$ (лямбда) - **средняя интенсивность** (среднее число событий за период).

**Удивительное свойство:** $E[X] = \lambda$ и $Var[X] = \lambda$ Среднее **равно** дисперсии! Это характерная черта процесса Пуассона.

Прусские кавалеристы

Классический пример Борткевича

За 20 лет в 14 корпусах было 196 смертей от копыт. Всего 280 "корпус-лет". $\lambda = 196/280 = 0.7$ смертей на корпус в год. Теория (Пуассон) vs реальность:

k смертей	Теория	Факт
0	139	144
1	97	91
2	34	32
3	8	11
4+	2	2

**Поразительное совпадение!** Формула 1837 года идеально описала смерти 1898 года.

Связь с биномиальным

Пуассон - это **предел биномиального** при $n \to \infty$, $p \to 0$, но $np = \lambda$ остаётся константой.

Интуиция: если разбить год на миллион секунд, вероятность смерти в каждую секунду крохотна (p ≈ 0.7/31536000), но "попыток" очень много. В пределе - Пуассон.

**Практическое правило:** используйте Пуассон вместо биномиального, если $n \geq 20$ и $p \leq 0.05$.

В колл-центр поступает в среднем 3 звонка в минуту. Какова вероятность, что за минуту не будет ни одного звонка?

$P(X=0) = \frac{3^0 \cdot e^{-3}}{0!} = e^{-3} \approx 0.05$. Даже при среднем 3 звонка/мин, в 5% случаев целую минуту никто не позвонит!

4. Геометрическое распределение - ожидание успеха

Другой важный вопрос: **сколько попыток** нужно до первого успеха?

Пример: кубик бросается, пока не выпадет шестёрка. Сколько бросков потребуется?

Вероятность, что первый успех случится **ровно на k-й попытке**:

Логика: первые k-1 попытки - неудачи ($q^{k-1}$), k-я - успех (p).

**Характеристики:** $E[X] = \frac{1}{p}$ - в среднем нужно 1/p попыток $Var[X] = \frac{1-p}{p^2}$

Легендарный дроп в игре

Шанс 1% на каждое убийство босса

p = 0.01 (шанс дропа) $E[X] = 1/0.01 = 100$ убийств в среднем до дропа $P(X = 1) = 0.01$ - повезёт с первого раза в 1% случаев $P(X > 100) = 0.99^{100} \approx 0.366$ - 37% игроков не получат дроп и за 100 попыток! $P(X > 300) = 0.99^{300} \approx 0.05$ - 5% будут фармить 300+ раз

Свойство "отсутствия памяти"

Геометрическое распределение обладает уникальным свойством - **отсутствием памяти**:

Словами: если уже сделано m неудачных попыток, это **никак не влияет** на будущее. Процесс как будто начинается с нуля!

После 99 неудач следующая попытка "должна" быть успешной

Каждая попытка независима. После 99 неудач вероятность успеха всё та же - p

Это ошибка игрока! Если босс уже убит 99 раз без дропа, шанс дропа на 100-й раз всё ещё 1%. Прошлые неудачи не "копятся".

Вероятность выиграть в лотерею - 0.001. Какова вероятность выиграть с первой попытки? А сколько билетов нужно в среднем?

P(X=1) = p = 0.001. E[X] = 1/p = 1/0.001 = 1000 билетов. В среднем нужна 1 тысяча билетов, но есть шанс (маленький) выиграть с первого!

Как выбрать распределение?

Задайте себе вопрос: **что именно я считаю?**

Вопрос	Распределение	Параметры
Успех или неудача (один опыт)?	Бернулли	p
Сколько успехов из n опытов?	Биномиальное	n, p
Сколько редких событий за период?	Пуассона	λ
Сколько попыток до успеха?	Геометрическое	p

Примеры из реального мира

Какое распределение использовать

**Число багов на 1000 строк кода** → Пуассон (редкие события) **Из 50 резюме - сколько приглашены?** → Биномиальное (фикс. число попыток) **Сколько собеседований до оффера?** → Геометрическое (ждём первый успех) **Купит ли этот клиент?** → Бернулли (да/нет)

Сервер падает в среднем 2 раза в месяц. Какое распределение описывает число падений за месяц?

Падения сервера - редкие независимые события за фиксированный период. Классический Пуассон с λ = 2. Можно было бы взять биномиальное (n=дни, p=2/30), но Пуассон точнее и проще.

Практика

В среднем 0.5 метеорита в год падает на территорию страны. Какова вероятность, что за год не упадёт ни одного? Хотя бы один?

$P(X=0) = \frac{0.5^0 \cdot e^{-0.5}}{0!} = e^{-0.5} \approx 0.606$ $P(X \geq 1) = 1 - 0.606 = 0.394 \approx 39\%$ Даже при среднем 0.5 метеорита/год, в 39% лет хотя бы один упадёт!

Тест из 20 вопросов, угадываете каждый с вероятностью 0.25. Какова вероятность ответить правильно хотя бы на 10?

$X \sim Binomial(20, 0.25)$ $E[X] = 20 \times 0.25 = 5$ - в среднем 5 правильных $P(X \geq 10)$ нужно считать суммированием или таблицей: $P(X \geq 10) \approx 0.014 = 1.4\%$ Шансы угадать половину теста - менее 2%!

Стартап имеет 10% шанс на успех. Инвестор вкладывает в стартапы последовательно. Какова вероятность, что первый успех будет не раньше 5-го стартапа? А среднее число до успеха?

$X \sim Geometric(0.1)$ $P(X \geq 5) = P(\text{первые 4 - неудачи}) = 0.9^4 \approx 0.656$ 66% шанс, что первые 4 стартапа провалятся! $E[X] = 1/0.1 = 10$ стартапов в среднем до первого успеха **Вывод:** инвестору нужен портфель из многих стартапов - один-два точно не сработают.

Колл-центр получает в среднем $\lambda = 3$ звонка в минуту, пуассоновский поток. Какова вероятность ровно 5 звонков за минуту?

Pmf Пуассона: $P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}$. Подставляем $\lambda = 3, k = 5$: $\frac{243\cdot e^{-3}}{120} \approx 0{,}1008$. Бомбардировка событиями с $E[X] = \lambda = 3$ делает 5 звонков примерно 10%-ным исходом.

Семейство дискретных распределений

Эти распределения связаны между собой и ведут к более сложным концепциям.

Непрерывные распределения — Пуассон → экспоненциальное (время между событиями)
Нормальное распределение — Биномиальное при большом n → нормальное
Отрицательное биномиальное — Обобщение геометрического: k успехов вместо 1
Процессы Пуассона — Основа теории очередей и страхования

Итоги

**Бернулли(p):** один опыт, успех/неудача. $E = p$, $Var = pq$
**Binomial(n, p):** число успехов из n опытов. $E = np$, $Var = npq$
**Poisson(λ):** редкие события за период. $E = Var = \lambda$
**Geometric(p):** попыток до успеха. $E = 1/p$, отсутствие памяти
**Пуассон = предел биномиального** при $n \to \infty$, $p \to 0$, $np = \lambda$

Вопросы для размышления

Почему у распределения Пуассона среднее равно дисперсии? Как это связано с природой редких событий?
Вернёмся к прусским кавалеристам: почему именно смерти от копыт хорошо описываются Пуассоном? Какие условия должны выполняться?
Геймдизайнер делает систему дропа с шансом 1%. Почему он должен предупреждать игроков о "свойстве отсутствия памяти"?
Если конверсия сайта 2%, сколько нужно посетителей, чтобы с 95% уверенностью получить хотя бы 100 покупок?

Связанные уроки

Теория вероятностей

Классические дискретные распределения

Цели урока

Освоить распределение Бернулли как базовый строительный блок
Понять биномиальное распределение и его применения
Разобраться, когда и почему возникает распределение Пуассона
Использовать геометрическое распределение для "времени ожидания"
Научиться выбирать правильное распределение для задачи

Предварительные знания

Случайные величины (дискретные и непрерывные)
Математическое ожидание E[X]
Дисперсия Var[X]

A/B тесты: конверсия на сайте (биномиальное)
Колл-центры: число звонков в час (Пуассон)
Онлайн-игры: сколько попыток до редкого дропа (геометрическое)
Страхование: число аварий в год (Пуассон)
Генетика: число мутаций в ДНК (Пуассон)

Закон малых чисел

Классические дискретные распределения

Какое распределение моделирует число успехов в $n$ независимых испытаниях Бернулли с вероятностью $p$?

1. Распределение Бернулли - атом вероятности

Всё начинается с **простейшего** случайного эксперимента: один опыт с двумя исходами.

Монета: орёл (1) или решка (0)
Клиент: купил (1) или ушёл (0)
Тест: сдал (1) или провалил (0)
Email: открыли (1) или нет (0)

где $p$ - вероятность "успеха" (единицы).

X	P(X)	Формула
0 (неудача)	q = 1-p	P(X=0) = 1-p
1 (успех)	p	P(X=1) = p

**Характеристики:** $E[X] = p$ - среднее равно вероятности успеха $Var[X] = p(1-p) = pq$ - максимум при $p = 0.5$

Конверсия на сайте - 3%. Для одного посетителя X = 1 если купил. Чему равна Var[X]?

2. Биномиальное распределение - сумма Бернулли

Что если провести **n независимых** экспериментов Бернулли и посчитать число успехов?

Пусть $X_1, X_2, ..., X_n$ - независимые $Bernoulli(p)$. Тогда:

Вероятность получить **ровно k успехов** из n попыток:

Разберём формулу по частям:

$C_n^k$ - число способов выбрать, **какие** k опытов будут успешными
$p^k$ - вероятность, что эти k опытов успешны
$(1-p)^{n-k}$ - вероятность, что остальные n-k неуспешны

**Характеристики:** $E[X] = np$ - в среднем np успехов $Var[X] = np(1-p)$ - сумма дисперсий независимых Бернулли

A/B тест

Конверсия нового дизайна

Честную монету подбросили 4 раза. Какова вероятность получить ровно 2 орла?

3. Распределение Пуассона - закон редких событий

События **редкие** (p мала)
События **независимые** (одно не влияет на другое)
Событие может произойти в **любой момент** с одинаковой скоростью

где $\lambda$ (лямбда) - **средняя интенсивность** (среднее число событий за период).

Прусские кавалеристы

Классический пример Борткевича

k смертей	Теория	Факт
0	139	144
1	97	91
2	34	32
3	8	11
4+	2	2

**Поразительное совпадение!** Формула 1837 года идеально описала смерти 1898 года.

Связь с биномиальным

Пуассон - это **предел биномиального** при $n \to \infty$, $p \to 0$, но $np = \lambda$ остаётся константой.

**Практическое правило:** используйте Пуассон вместо биномиального, если $n \geq 20$ и $p \leq 0.05$.

$P(X=0) = \frac{3^0 \cdot e^{-3}}{0!} = e^{-3} \approx 0.05$. Даже при среднем 3 звонка/мин, в 5% случаев целую минуту никто не позвонит!

4. Геометрическое распределение - ожидание успеха

Другой важный вопрос: **сколько попыток** нужно до первого успеха?

Пример: кубик бросается, пока не выпадет шестёрка. Сколько бросков потребуется?

Вероятность, что первый успех случится **ровно на k-й попытке**:

Логика: первые k-1 попытки - неудачи ($q^{k-1}$), k-я - успех (p).

**Характеристики:** $E[X] = \frac{1}{p}$ - в среднем нужно 1/p попыток $Var[X] = \frac{1-p}{p^2}$

Легендарный дроп в игре

Шанс 1% на каждое убийство босса

Свойство "отсутствия памяти"

Геометрическое распределение обладает уникальным свойством - **отсутствием памяти**:

После 99 неудач следующая попытка "должна" быть успешной

Каждая попытка независима. После 99 неудач вероятность успеха всё та же - p

Как выбрать распределение?

Задайте себе вопрос: **что именно я считаю?**

Вопрос	Распределение	Параметры
Успех или неудача (один опыт)?	Бернулли	p
Сколько успехов из n опытов?	Биномиальное	n, p
Сколько редких событий за период?	Пуассона	λ
Сколько попыток до успеха?	Геометрическое	p

Примеры из реального мира

Какое распределение использовать

Сервер падает в среднем 2 раза в месяц. Какое распределение описывает число падений за месяц?

Практика

Тест из 20 вопросов, угадываете каждый с вероятностью 0.25. Какова вероятность ответить правильно хотя бы на 10?

Семейство дискретных распределений

Эти распределения связаны между собой и ведут к более сложным концепциям.

Непрерывные распределения — Пуассон → экспоненциальное (время между событиями)
Нормальное распределение — Биномиальное при большом n → нормальное
Отрицательное биномиальное — Обобщение геометрического: k успехов вместо 1
Процессы Пуассона — Основа теории очередей и страхования

Итоги

**Бернулли(p):** один опыт, успех/неудача. $E = p$, $Var = pq$
**Binomial(n, p):** число успехов из n опытов. $E = np$, $Var = npq$
**Poisson(λ):** редкие события за период. $E = Var = \lambda$
**Geometric(p):** попыток до успеха. $E = 1/p$, отсутствие памяти
**Пуассон = предел биномиального** при $n \to \infty$, $p \to 0$, $np = \lambda$

Вопросы для размышления

Почему у распределения Пуассона среднее равно дисперсии? Как это связано с природой редких событий?
Вернёмся к прусским кавалеристам: почему именно смерти от копыт хорошо описываются Пуассоном? Какие условия должны выполняться?
Геймдизайнер делает систему дропа с шансом 1%. Почему он должен предупреждать игроков о "свойстве отсутствия памяти"?
Если конверсия сайта 2%, сколько нужно посетителей, чтобы с 95% уверенностью получить хотя бы 100 покупок?