Теория вероятностей
Непрерывные распределения
Цели урока
- Понять разницу между дискретными и непрерывными распределениями
- Освоить равномерное распределение как "идеальный случай"
- Разобраться в экспоненциальном распределении и его свойствах
- Понять связь между процессом Пуассона и экспоненциальным распределением
- Применять эти распределения к реальным задачам
Предварительные знания
- Случайные величины и плотность распределения
- Дискретные распределения (особенно Пуассон)
- Интегрирование
**Парадокс ожидания автобуса.** Автобусы ходят каждые 10 минут в среднем. Прибытие на остановку - в случайный момент. Сколько составит ожидание? Интуиция подсказывает: 5 минут (половина интервала). Но на практике ожидание оказывается **дольше**! Почему? Ответ в том, как устроено распределение интервалов.
- Радиоактивный распад: когда распадётся ядро?
- Надёжность техники: когда сломается сервер?
- Очереди: сколько ждать кассу в супермаркете?
- Телекоммуникации: интервалы между пакетами данных
- Страхование: когда произойдёт страховой случай?
Случайность радиоактивного распада
Физики заметили, что щёлчки счётчика Гейгера следуют странному паттерну: интервалы между щелчками **не одинаковы**, но подчиняются простой формуле. Это экспоненциальное распределение - и оно появляется везде, где события "не имеют памяти".
Непрерывные распределения
Непрерывные распределения описывают величины, принимающие любое значение в интервале: время ожидания, рост, температура. У них нет 'веса' в отдельной точке - вместо этого есть **плотность вероятности** $f(x)$, и вероятность попасть в интервал получается интегрированием.
Главные непрерывные распределения: **равномерное** (все исходы интервала равновозможны), **экспоненциальное** (время между редкими событиями), **нормальное** (классика - в следующем уроке). У каждого своя 'история' и свои уравнения для $\mathbb{E}$ и $\text{Var}$.
Свойство 'отсутствия памяти' экспоненциального распределения объясняет парадокс автобуса: чем дольше ждёте, тем не меньше ожидаемое оставшееся время. Это математически точно, хотя интуитивно странно.
В чём ключевое отличие непрерывной случайной величины от дискретной?
Для непрерывной $X$ имеет смысл только $P(a<X<b)=\int_a^b f(x)dx$, где $f$ - плотность. Точечная вероятность - всегда ноль. Это отличает интегральное определение от дискретной суммы.
1. Равномерное распределение - демократия вероятностей
1. Равномерное распределение - демократия вероятностей
Начнём с простейшего случая: **все значения равновероятны**.
Пусть точка на отрезке [0, 10] выбирается случайно. Какова вероятность попасть ближе к 3, чем к 7? Ближе к началу, чем к концу?
Плотность **постоянна** на всём интервале:
Почему $1/(b-a)$? Потому что площадь под графиком плотности должна равняться 1:
**Характеристики:** $E[X] = \frac{a + b}{2}$ - середина интервала $Var[X] = \frac{(b-a)^2}{12}$
Вероятность попасть в подинтервал - это просто **доля длин**:
Идеальный автобус
Если бы интервалы были равномерными
Автобусы ходят ровно каждые 10 минут. Прибытие происходит в случайный момент. Время ожидания $X \sim U(0, 10)$. $E[X] = \frac{0 + 10}{2} = 5$ минут - как и ожидалось! $P(X > 8) = \frac{10 - 8}{10 - 0} = 20\%$ Но в реальности интервалы **не** равномерны...
Случайная точка выбирается равномерно на отрезке [0, 100]. Какова вероятность, что она попадёт в интервал [40, 60]?
$P(40 \leq X \leq 60) = \frac{60 - 40}{100 - 0} = \frac{20}{100} = 20\%$. Длина подинтервала делённая на длину всего интервала.
2. Экспоненциальное распределение - время ожидания
2. Экспоненциальное распределение - время ожидания
А теперь реальность. В процессе Пуассона события происходят **случайно и независимо**. Число событий за время t - это $Poisson(\lambda t)$.
Вопрос: сколько **времени** пройдёт до следующего события?
Плотность экспоненциально убывает:
Функция распределения (вероятность, что событие произойдёт до момента t):
И очень полезная формула для "хвоста":
**Характеристики:** $E[T] = \frac{1}{\lambda}$ - среднее время ожидания $Var[T] = \frac{1}{\lambda^2}$ $\sigma = \frac{1}{\lambda} = E[T]$ - стандартное отклонение равно среднему!
Надёжность сервера
Сервер падает в среднем раз в месяц
$\lambda = 1$ падение/месяц, значит $E[T] = 1$ месяц. **Какова вероятность, что сервер проработает 2 месяца без падения?** $P(T > 2) = e^{-1 \cdot 2} = e^{-2} \approx 0.135 = 13.5\%$ **А вероятность падения в первую неделю?** 1 неделя ≈ 0.25 месяца. $P(T < 0.25) = 1 - e^{-0.25} \approx 0.22 = 22\%$
Клиенты приходят в магазин в среднем 6 раз в час (Пуассон). Какое среднее время между клиентами?
Если λ = 6 клиентов/час, то среднее время между клиентами E[T] = 1/λ = 1/6 часа = 10 минут. Экспоненциальное распределение!
3. Свойство отсутствия памяти
3. Свойство отсутствия памяти
Экспоненциальное распределение обладает удивительным свойством - **отсутствием памяти**:
Перевод: если уже прошло s минут ожидания и событие не произошло, вероятность ждать ещё t минут такая же, как если бы отсчёт начался заново!
Докажем:
Если я уже долго жду, то скоро что-то случится
В экспоненциальном распределении прошлое не влияет на будущее
Интуиция нас подводит! Если сервер работал 2 месяца без падения, это **не** значит, что он "скоро упадёт". Вероятность падения в следующий месяц та же самая. Прошлое "стирается".
**Реалистично ли это?** Для радиоактивного распада - да. Для лампочек и серверов - не совсем. Реальные устройства "стареют", и вероятность отказа растёт со временем. Для таких случаев используют распределение Вейбулла.
Лампочка со средним временем жизни 1000 часов проработала 999 часов. Какова вероятность, что она проработает ещё 1000 часов?
Из-за отсутствия памяти 999 отработанных часов НЕ влияют на будущее! P(ещё 1000 часов) = P(T > 1000) = e^(-1) ≈ 37%. Та же вероятность, что и для новой лампочки.
4. Разгадка парадокса автобуса
4. Разгадка парадокса автобуса
Теперь мы можем объяснить парадокс! Если автобусы приходят по **процессу Пуассона**, то интервалы между ними - **экспоненциальные**.
Пусть автобусы приходят в среднем каждые 10 минут (λ = 0.1 автобуса/мин). Интервал между автобусами:
Но вот фокус: при прибытии в **случайный** момент вероятнее попасть в **длинный** интервал!
**Парадокс инспекции:** при выборе случайной точки на временной оси, вероятность попасть в интервал пропорциональна его длине. Длинные интервалы "ловят" больше случайных моментов.
Из-за экспоненциального распределения интервалов, среднее время ожидания **случайного** пассажира:
Это потому что экспоненциальное распределение имеет отсутствие памяти: независимо от момента прибытия среднее время до следующего автобуса - всё те же 10 минут.
Автобусы идут по Пуассону со средним интервалом 15 минут. Прибытие на остановку - в случайный момент. Каково среднее время ожидания?
При пуассоновском процессе время ожидания - экспоненциальное. Из-за отсутствия памяти среднее ожидание = среднему интервалу = 15 минут. Это и есть "парадокс автобуса"!
5. Другие непрерывные распределения
5. Другие непрерывные распределения
Равномерное и экспоненциальное - это базовые кирпичики. Вот ещё несколько важных:
| Распределение | Применение | Особенность |
|---|---|---|
| Гамма(α, β) | Время до α-го события | Сумма α экспоненциальных |
| Бета(α, β) | Вероятности, пропорции | На отрезке [0, 1] |
| Вейбулла(k, λ) | Надёжность с "износом" | Обобщает экспоненциальное |
| Нормальное(μ, σ) | Везде! | Следующий урок! |
**Связь Пуассон ↔ Экспоненциальное ↔ Гамма:** - Число событий за время t → Poisson(λt) - Время до 1-го события → Exp(λ) - Время до k-го события → Gamma(k, λ)
Какое распределение описывает время до 3-го звонка в колл-центр, если звонки - пуассоновский процесс?
Время до 1-го события - экспоненциальное. Время до k-го события - сумма k независимых экспоненциальных, что даёт гамма-распределение с параметром α = k.
Практика
Практика
Время загрузки страницы равномерно распределено от 2 до 8 секунд. Найдите вероятность, что страница загрузится быстрее 3 секунд.
$P(X < 3) = \frac{3 - 2}{8 - 2} = \frac{1}{6} \approx 16.7\%$
Сервер падает в среднем раз в 30 дней. Какова вероятность, что он не упадёт в ближайшие 60 дней?
$\lambda = \frac{1}{30}$ $P(T > 60) = e^{-\frac{60}{30}} = e^{-2} \approx 0.135 = 13.5\%$ Только 13.5% шанс пережить два средних периода!
Радиоактивный изотоп имеет период полураспада 10 лет (половина ядер распадётся за 10 лет). Найдите λ и вероятность, что конкретное ядро распадётся в течение 1 года.
$P(T < 10) = 1 - e^{-10\lambda} = 0.5$ $e^{-10\lambda} = 0.5$ $-10\lambda = \ln(0.5) = -\ln(2)$ $\lambda = \frac{\ln(2)}{10} \approx 0.0693$ год$^{-1}$ $P(T < 1) = 1 - e^{-0.0693} \approx 0.067 = 6.7\%$ Около 6.7% ядер распадётся за первый год.
Сервер падает в среднем раз в 30 дней (экспоненциальное время до отказа). Какова вероятность, что он не упадёт ближайшие 60 дней?
Для $T \sim Exp(\lambda)$ с $E[T] = 30$ имеем $\lambda = 1/30$. Тогда $P(T > 60) = e^{-\lambda\cdot 60} = e^{-2} \approx 0{,}135$. Экспоненциальное распределение - без памяти, поэтому хвост падает быстро.
Мост между дискретным и непрерывным
Эти распределения связывают подсчёт событий с измерением времени.
- Процесс Пуассона — Число событий (дискретно) + время между ними (непрерывно)
- Нормальное распределение — Предел многих распределений при больших n
- Теория очередей — Моделирование систем обслуживания
- Анализ надёжности — Время до отказа и показатели надёжности
Итоги
- **Равномерное U(a,b):** все значения равновероятны, $E = (a+b)/2$
- **Экспоненциальное Exp(λ):** время ожидания, $f(t) = \lambda e^{-\lambda t}$, $E = 1/\lambda$
- **Отсутствие памяти:** $P(T > s+t | T > s) = P(T > t)$ - прошлое не влияет на будущее
- **Парадокс автобуса:** при пуассоновском процессе ожидание = средний интервал, а не половина
- **Связь:** Poisson(число) ↔ Exponential(время до 1-го) ↔ Gamma(время до k-го)
Вопросы для размышления
- Вернёмся к парадоксу автобуса: как изменилось бы среднее ожидание, если бы интервалы были равномерными (не экспоненциальными)?
- Почему отсутствие памяти реалистично для радиоактивного распада, но нереалистично для износа механизмов?
- Если среднее время работы сервера - 1 год, какой процент серверов "доживёт" до 3 лет?
- Экспоненциальное распределение - единственное непрерывное с отсутствием памяти. Какое дискретное распределение тоже имеет это свойство?