Теория вероятностей

Непрерывные распределения

Цели урока

  • Понять разницу между дискретными и непрерывными распределениями
  • Освоить равномерное распределение как "идеальный случай"
  • Разобраться в экспоненциальном распределении и его свойствах
  • Понять связь между процессом Пуассона и экспоненциальным распределением
  • Применять эти распределения к реальным задачам

Предварительные знания

  • Случайные величины и плотность распределения
  • Дискретные распределения (особенно Пуассон)
  • Интегрирование
  • Случайные величины
  • Дискретные распределения

**Парадокс ожидания автобуса.** Автобусы ходят каждые 10 минут в среднем. Прибытие на остановку - в случайный момент. Сколько составит ожидание? Интуиция подсказывает: 5 минут (половина интервала). Но на практике ожидание оказывается **дольше**! Почему? Ответ в том, как устроено распределение интервалов.

  • Радиоактивный распад: когда распадётся ядро?
  • Надёжность техники: когда сломается сервер?
  • Очереди: сколько ждать кассу в супермаркете?
  • Телекоммуникации: интервалы между пакетами данных
  • Страхование: когда произойдёт страховой случай?

Случайность радиоактивного распада

Физики заметили, что щёлчки счётчика Гейгера следуют странному паттерну: интервалы между щелчками **не одинаковы**, но подчиняются простой формуле. Это экспоненциальное распределение - и оно появляется везде, где события "не имеют памяти".

Непрерывные распределения

Непрерывные распределения описывают величины, принимающие любое значение в интервале: время ожидания, рост, температура. У них нет 'веса' в отдельной точке - вместо этого есть **плотность вероятности** $f(x)$, и вероятность попасть в интервал получается интегрированием.

Главные непрерывные распределения: **равномерное** (все исходы интервала равновозможны), **экспоненциальное** (время между редкими событиями), **нормальное** (классика - в следующем уроке). У каждого своя 'история' и свои уравнения для $\mathbb{E}$ и $\text{Var}$.

Свойство 'отсутствия памяти' экспоненциального распределения объясняет парадокс автобуса: чем дольше ждёте, тем не меньше ожидаемое оставшееся время. Это математически точно, хотя интуитивно странно.

В чём ключевое отличие непрерывной случайной величины от дискретной?

Для непрерывной $X$ имеет смысл только $P(a<X<b)=\int_a^b f(x)dx$, где $f$ - плотность. Точечная вероятность - всегда ноль. Это отличает интегральное определение от дискретной суммы.

1. Равномерное распределение - демократия вероятностей

1. Равномерное распределение - демократия вероятностей

Начнём с простейшего случая: **все значения равновероятны**.

Пусть точка на отрезке [0, 10] выбирается случайно. Какова вероятность попасть ближе к 3, чем к 7? Ближе к началу, чем к концу?

Плотность **постоянна** на всём интервале:

Почему $1/(b-a)$? Потому что площадь под графиком плотности должна равняться 1:

**Характеристики:** $E[X] = \frac{a + b}{2}$ - середина интервала $Var[X] = \frac{(b-a)^2}{12}$

Вероятность попасть в подинтервал - это просто **доля длин**:

Идеальный автобус

Если бы интервалы были равномерными

Автобусы ходят ровно каждые 10 минут. Прибытие происходит в случайный момент. Время ожидания $X \sim U(0, 10)$. $E[X] = \frac{0 + 10}{2} = 5$ минут - как и ожидалось! $P(X > 8) = \frac{10 - 8}{10 - 0} = 20\%$ Но в реальности интервалы **не** равномерны...

Случайная точка выбирается равномерно на отрезке [0, 100]. Какова вероятность, что она попадёт в интервал [40, 60]?

$P(40 \leq X \leq 60) = \frac{60 - 40}{100 - 0} = \frac{20}{100} = 20\%$. Длина подинтервала делённая на длину всего интервала.

2. Экспоненциальное распределение - время ожидания

2. Экспоненциальное распределение - время ожидания

А теперь реальность. В процессе Пуассона события происходят **случайно и независимо**. Число событий за время t - это $Poisson(\lambda t)$.

Вопрос: сколько **времени** пройдёт до следующего события?

Плотность экспоненциально убывает:

Функция распределения (вероятность, что событие произойдёт до момента t):

И очень полезная формула для "хвоста":

**Характеристики:** $E[T] = \frac{1}{\lambda}$ - среднее время ожидания $Var[T] = \frac{1}{\lambda^2}$ $\sigma = \frac{1}{\lambda} = E[T]$ - стандартное отклонение равно среднему!

Надёжность сервера

Сервер падает в среднем раз в месяц

$\lambda = 1$ падение/месяц, значит $E[T] = 1$ месяц. **Какова вероятность, что сервер проработает 2 месяца без падения?** $P(T > 2) = e^{-1 \cdot 2} = e^{-2} \approx 0.135 = 13.5\%$ **А вероятность падения в первую неделю?** 1 неделя ≈ 0.25 месяца. $P(T < 0.25) = 1 - e^{-0.25} \approx 0.22 = 22\%$

Клиенты приходят в магазин в среднем 6 раз в час (Пуассон). Какое среднее время между клиентами?

Если λ = 6 клиентов/час, то среднее время между клиентами E[T] = 1/λ = 1/6 часа = 10 минут. Экспоненциальное распределение!

3. Свойство отсутствия памяти

3. Свойство отсутствия памяти

Экспоненциальное распределение обладает удивительным свойством - **отсутствием памяти**:

Перевод: если уже прошло s минут ожидания и событие не произошло, вероятность ждать ещё t минут такая же, как если бы отсчёт начался заново!

Докажем:

Если я уже долго жду, то скоро что-то случится

В экспоненциальном распределении прошлое не влияет на будущее

Интуиция нас подводит! Если сервер работал 2 месяца без падения, это **не** значит, что он "скоро упадёт". Вероятность падения в следующий месяц та же самая. Прошлое "стирается".

**Реалистично ли это?** Для радиоактивного распада - да. Для лампочек и серверов - не совсем. Реальные устройства "стареют", и вероятность отказа растёт со временем. Для таких случаев используют распределение Вейбулла.

Лампочка со средним временем жизни 1000 часов проработала 999 часов. Какова вероятность, что она проработает ещё 1000 часов?

Из-за отсутствия памяти 999 отработанных часов НЕ влияют на будущее! P(ещё 1000 часов) = P(T > 1000) = e^(-1) ≈ 37%. Та же вероятность, что и для новой лампочки.

4. Разгадка парадокса автобуса

4. Разгадка парадокса автобуса

Теперь мы можем объяснить парадокс! Если автобусы приходят по **процессу Пуассона**, то интервалы между ними - **экспоненциальные**.

Пусть автобусы приходят в среднем каждые 10 минут (λ = 0.1 автобуса/мин). Интервал между автобусами:

Но вот фокус: при прибытии в **случайный** момент вероятнее попасть в **длинный** интервал!

**Парадокс инспекции:** при выборе случайной точки на временной оси, вероятность попасть в интервал пропорциональна его длине. Длинные интервалы "ловят" больше случайных моментов.

Из-за экспоненциального распределения интервалов, среднее время ожидания **случайного** пассажира:

Это потому что экспоненциальное распределение имеет отсутствие памяти: независимо от момента прибытия среднее время до следующего автобуса - всё те же 10 минут.

Автобусы идут по Пуассону со средним интервалом 15 минут. Прибытие на остановку - в случайный момент. Каково среднее время ожидания?

При пуассоновском процессе время ожидания - экспоненциальное. Из-за отсутствия памяти среднее ожидание = среднему интервалу = 15 минут. Это и есть "парадокс автобуса"!

5. Другие непрерывные распределения

5. Другие непрерывные распределения

Равномерное и экспоненциальное - это базовые кирпичики. Вот ещё несколько важных:

РаспределениеПрименениеОсобенность
Гамма(α, β)Время до α-го событияСумма α экспоненциальных
Бета(α, β)Вероятности, пропорцииНа отрезке [0, 1]
Вейбулла(k, λ)Надёжность с "износом"Обобщает экспоненциальное
Нормальное(μ, σ)Везде!Следующий урок!

**Связь Пуассон ↔ Экспоненциальное ↔ Гамма:** - Число событий за время t → Poisson(λt) - Время до 1-го события → Exp(λ) - Время до k-го события → Gamma(k, λ)

Какое распределение описывает время до 3-го звонка в колл-центр, если звонки - пуассоновский процесс?

Время до 1-го события - экспоненциальное. Время до k-го события - сумма k независимых экспоненциальных, что даёт гамма-распределение с параметром α = k.

Практика

Практика

Время загрузки страницы равномерно распределено от 2 до 8 секунд. Найдите вероятность, что страница загрузится быстрее 3 секунд.

$P(X < 3) = \frac{3 - 2}{8 - 2} = \frac{1}{6} \approx 16.7\%$

Сервер падает в среднем раз в 30 дней. Какова вероятность, что он не упадёт в ближайшие 60 дней?

$\lambda = \frac{1}{30}$ $P(T > 60) = e^{-\frac{60}{30}} = e^{-2} \approx 0.135 = 13.5\%$ Только 13.5% шанс пережить два средних периода!

Радиоактивный изотоп имеет период полураспада 10 лет (половина ядер распадётся за 10 лет). Найдите λ и вероятность, что конкретное ядро распадётся в течение 1 года.

$P(T < 10) = 1 - e^{-10\lambda} = 0.5$ $e^{-10\lambda} = 0.5$ $-10\lambda = \ln(0.5) = -\ln(2)$ $\lambda = \frac{\ln(2)}{10} \approx 0.0693$ год$^{-1}$ $P(T < 1) = 1 - e^{-0.0693} \approx 0.067 = 6.7\%$ Около 6.7% ядер распадётся за первый год.

Сервер падает в среднем раз в 30 дней (экспоненциальное время до отказа). Какова вероятность, что он не упадёт ближайшие 60 дней?

Для $T \sim Exp(\lambda)$ с $E[T] = 30$ имеем $\lambda = 1/30$. Тогда $P(T > 60) = e^{-\lambda\cdot 60} = e^{-2} \approx 0{,}135$. Экспоненциальное распределение - без памяти, поэтому хвост падает быстро.

Мост между дискретным и непрерывным

Эти распределения связывают подсчёт событий с измерением времени.

  • Процесс Пуассона — Число событий (дискретно) + время между ними (непрерывно)
  • Нормальное распределение — Предел многих распределений при больших n
  • Теория очередей — Моделирование систем обслуживания
  • Анализ надёжности — Время до отказа и показатели надёжности

Итоги

  • **Равномерное U(a,b):** все значения равновероятны, $E = (a+b)/2$
  • **Экспоненциальное Exp(λ):** время ожидания, $f(t) = \lambda e^{-\lambda t}$, $E = 1/\lambda$
  • **Отсутствие памяти:** $P(T > s+t | T > s) = P(T > t)$ - прошлое не влияет на будущее
  • **Парадокс автобуса:** при пуассоновском процессе ожидание = средний интервал, а не половина
  • **Связь:** Poisson(число) ↔ Exponential(время до 1-го) ↔ Gamma(время до k-го)

Вопросы для размышления

  • Вернёмся к парадоксу автобуса: как изменилось бы среднее ожидание, если бы интервалы были равномерными (не экспоненциальными)?
  • Почему отсутствие памяти реалистично для радиоактивного распада, но нереалистично для износа механизмов?
  • Если среднее время работы сервера - 1 год, какой процент серверов "доживёт" до 3 лет?
  • Экспоненциальное распределение - единственное непрерывное с отсутствием памяти. Какое дискретное распределение тоже имеет это свойство?

Связанные уроки

  • aie-03-llm-fundamentals
  • stat-01-sampling
Непрерывные распределения

0

1

Войти