Логика

Статистические ошибки

Мы живём в эпоху данных. Каждый день - графики, проценты, исследования. Но числа могут обманывать не хуже слов. Научившись видеть статистические манипуляции, вы обретёте иммунитет к большинству современной пропаганды.

  • **Новости**: «Преступность выросла на 50%!» — с 2 до 3 случаев в маленьком районе
  • **Реклама**: «9 из 10 врачей рекомендуют» — из специально отобранных 10
  • **Политика**: Графики с обрезанной осью Y для драматизации незначительных изменений

Ошибка игрока

Рулетка выпала красное 10 раз подряд. Игрок думает: «Сейчас *точно* будет чёрное - красное уже столько раз было!» Он ставит всё на чёрное... и проигрывает. Это **ошибка игрока** - вера в то, что прошлые случайные события влияют на будущие.

**Gambler's fallacy** (ошибка игрока) - заблуждение, что вероятность случайного события зависит от предыдущих результатов. На самом деле каждый бросок монеты или спин рулетки - *независимое* событие с неизменной вероятностью.

**Обратная ошибка - hot hand fallacy**: «У него серия попаданий, значит он *разогрелся* и будет попадать дальше!» Если события независимы - прошлое не предсказывает будущее.

В семье родилось 4 мальчика подряд. Какова вероятность, что 5-й ребёнок будет девочкой?

Техасский стрелок

Техасец стреляет в амбар, потом рисует мишень вокруг дырок и хвастается: «Смотрите, все попадания в яблочко!» Это **texas sharpshooter fallacy** - находить паттерн в случайных данных *после* того, как вы их увидели.

**Texas sharpshooter fallacy** - выбор или группировка данных *после* их сбора, чтобы создать иллюзию значимого паттерна. Проблема: в любом случайном наборе данных можно найти кластеры, которые выглядят неслучайно.

**Защита:** спрашивайте «Гипотеза была сформулирована ДО или ПОСЛЕ данных?» Научный метод требует: сначала гипотеза, потом проверка. Не наоборот.

Исследователь проанализировал 1000 переменных и нашёл корреляцию между потреблением сыра и количеством запутавшихся в простынях смертей. Это значимо?

Cherry-picking - выборочное цитирование

«Глобальное потепление - миф! Вот исследование, опровергающее его!» - говорит человек, игнорируя сотни исследований, подтверждающих потепление. Это **cherry-picking** - выбор только тех данных, которые поддерживают вашу позицию.

**Cherry-picking** (выборочное цитирование) - выбор только тех данных, примеров или исследований, которые подтверждают желаемый вывод, игнорируя противоречащие. Это манипуляция, даже если каждый отдельный факт верен.

**Защита:** ищите *мета-анализы* и *систематические обзоры* - они анализируют ВСЕ исследования. Спрашивайте: «Это типичный пример или исключение?»

Компания показывает график роста акций с января по март (+30%). При этом за год акции упали на 20%. Это cherry-picking?

Обманчивая статистика

«Средняя зарплата в компании - 100 тысяч». Звучит хорошо! Но если директор получает 900 тысяч, а 9 сотрудников по 11 тысяч, среднее - 100к, а медиана - 11к. **Обманчивая статистика** - когда числа верны, но интерпретация вводит в заблуждение.

**Misleading statistics** - использование статистически верных данных способом, который создаёт ложное впечатление. Включает: путаницу среднего/медианы, манипуляции с базой/шкалой, выбор удобных метрик.

**Правила защиты:** 1. Спросите: среднее или медиана? 2. Смотрите абсолютные числа, не только проценты 3. Проверяйте шкалу графиков 4. Ищите базу сравнения и контекст

Статистика объективна и не может врать

Статистика может быть верной математически, но обманчивой по интерпретации

«Числа не врут, но вруны используют числа» - выбор метрики, периода, визуализации может радикально изменить впечатление при идентичных данных

«Препарат удваивает ваши шансы на выздоровление!» (с 0.5% до 1%). Как правильно интерпретировать?

Ключевые идеи

  • **Gambler's fallacy**: прошлые случайные события не влияют на будущие. Монета не имеет памяти
  • **Texas sharpshooter**: поиск паттернов после данных создаёт иллюзию. Гипотеза должна быть до данных
  • **Cherry-picking**: выбор только поддерживающих данных. Ищите полную картину и мета-анализы
  • **Misleading statistics**: среднее vs медиана, относительный vs абсолютный риск, шкала графиков

Связанные темы

Статистические fallacies - о критическом восприятии данных:

  • Ошибки двусмысленности — Предыдущая категория - манипуляции словами
  • Практика: СМИ — Применение всех fallacies к анализу медиа

Вопросы для размышления

  • Какие статистики вы принимали на веру, не проверяя контекст?
  • Вспомните случай, когда «впечатляющий процент» оказался незначительным в абсолютных числах
  • Как бы вы представили негативную статистику о своей компании, чтобы она выглядела позитивно?

Связанные уроки

  • stat-05-hypothesis
Статистические ошибки

0

1

Войти