Теория вероятностей

Нормальное распределение

1733: Абрахам де Муавр впервые выводит колокол как предел биномиального распределения. 1809: Гаусс переоткрывает его, обрабатывая ошибки астрономических наблюдений. 1810: Лаплас публикует первую общую версию ЦПТ. А в 1986 инженер Motorola Билл Смит использует это распределение, чтобы изобрести Six Sigma: производить так, чтобы брак был дальше 6 стандартных отклонений от номинала. 3.4 дефекта на миллион. Motorola выжила; методология стала отраслевым эталоном.

Контроль качества: Six Sigma, допуски деталей - Boeing, Toyota, GE
Биология: рост, вес, IQ - все следуют колоколу из-за ЦПТ
Финансы: модель Блэка-Шоулза для опционов предполагает log-normal цены
Физика: тепловое движение молекул (распределение Максвелла)
ML: инициализация весов нейросети, BatchNorm → ≈N(0,1)

Предварительные знания

Непрерывные распределения и плотность вероятности
Математическое ожидание и дисперсия
Понятие стандартного отклонения

N(μ, σ²): колокол и его параметры

1733 год: Абрахам де Муавр в работе "Approximatio ad summam terminorum binomii" замечает, что биномиальное распределение при больших n принимает форму колокола. Это первое появление нормального закона - за 76 лет до того, как Гаусс в 1809 году переоткрыл его при анализе ошибок астрономических наблюдений в "Theoria Motus". В 1810 Лаплас доказывает первую общую версию ЦПТ; строгое доказательство Ляпунов даст в 1901 году.

Нормальное распределение X ~ N(μ, σ²) определяется двумя параметрами: **μ** (мю) - центр колокола, **σ** (сигма) - его ширина. Плотность:

**Правило симметрии:** Среднее = медиана = мода = μ. Кривая симметрична относительно μ. Увеличение σ вдвое делает колокол вдвое шире и вдвое ниже - площадь под кривой всегда равна 1.

**Правило 68-95-99.7** - главный инструмент работы с нормальным распределением в голове, без таблиц:

IQ ~ N(100, 225), то есть μ=100, σ=15. Примерно какой процент людей имеет IQ выше 130?

Центральная предельная теорема: почему нормальное везде

Нормальное распределение появляется не потому, что мир "нормален". Оно появляется потому, что мы часто наблюдаем **суммы** или **средние** множества независимых величин. Центральная предельная теорема (ЦПТ) объясняет этот феномен.

**ЦПТ:** Пусть X₁, X₂, ..., Xₙ - независимые одинаково распределённые случайные величины с конечными μ и σ². Тогда при n → ∞: $$\bar{X}_n = \frac{X_1 + \ldots + X_n}{n} \xrightarrow{d} N\left(\mu,\, \frac{\sigma^2}{n}\right)$$ Независимо от исходного распределения!

Поэтому нормальное распределение появляется в природе и науке: рост человека - это сумма генетических и средовых факторов; ошибки измерений - сумма множества мелких неточностей; шум в электронике - суперпозиция тепловых флуктуаций.

ЦПТ говорит, что выборочное среднее n=100 наблюдений из Exp(λ=2) (μ=0.5, σ=0.5) имеет приближённое распределение:

Z-тест, доверительные интервалы, log-normal

Стандартизация z = (x - μ)/σ переводит любое N(μ, σ²) в стандартное N(0,1). Это позволяет пользоваться одной таблицей Φ(z) для всех нормальных распределений. Z-оценка показывает, насколько редко встречается данное значение.

**Когда нормальное НЕ подходит:** доходы (правый хвост тяжёлый, лог-нормальное лучше), время до отказа (экспоненциальное/Вейбулл), число событий (Пуассон), пропорции (бета-распределение). Всегда проверяйте QQ-plot перед применением нормальных методов.

X ~ N(50, 100). Стандартизированное значение x = 70 равно z = ?

Итог

**N(μ, σ²):** колоколообразная кривая, симметричная, медиана = мода = среднее = μ
**Правило 68-95-99.7:** доля значений в пределах 1σ, 2σ, 3σ от среднего
**ЦПТ:** среднее n iid переменных → N(μ, σ²/n) - отсюда нормальное везде в природе
**Z-score:** z = (x - μ)/σ - стандартизация для работы с таблицей Φ(z)
**Six Sigma:** допуск на 6σ от среднего = 3.4 дефекта на миллион

Нормальное - основа всей статистики

Нормальное распределение соединяет вероятность с практической статистикой.

Центральная предельная теорема — Объясняет, почему нормальное появляется везде
Доверительные интервалы — Строятся через z-критические значения
Проверка гипотез — Z-тест и t-тест основаны на нормальном

Вопросы для размышления

Как компания может уменьшить σ своего производственного процесса? Что технически для этого нужно?
Почему доходы населения НЕ распределены нормально, а рост людей - распределён? Что отличает эти ситуации?
Z-score = 4 для результата спортсмена - насколько это редкий результат? Сколько людей из миллиона имеют такой z-score?

Связанные уроки

N(μ, σ²): колокол и его параметры

**Правило 68-95-99.7** - главный инструмент работы с нормальным распределением в голове, без таблиц:

IQ ~ N(100, 225), то есть μ=100, σ=15. Примерно какой процент людей имеет IQ выше 130?

Центральная предельная теорема: почему нормальное везде

ЦПТ говорит, что выборочное среднее n=100 наблюдений из Exp(λ=2) (μ=0.5, σ=0.5) имеет приближённое распределение:

Z-тест, доверительные интервалы, log-normal

X ~ N(50, 100). Стандартизированное значение x = 70 равно z = ?

Итог

**N(μ, σ²):** колоколообразная кривая, симметричная, медиана = мода = среднее = μ

**Правило 68-95-99.7:** доля значений в пределах 1σ, 2σ, 3σ от среднего

**ЦПТ:** среднее n iid переменных → N(μ, σ²/n) - отсюда нормальное везде в природе

**Z-score:** z = (x - μ)/σ - стандартизация для работы с таблицей Φ(z)

**Six Sigma:** допуск на 6σ от среднего = 3.4 дефекта на миллион