Логика
Статистические ошибки
Мы живём в эпоху данных. Каждый день - графики, проценты, исследования. Но числа могут обманывать не хуже слов. Научившись видеть статистические манипуляции, вы обретёте иммунитет к большинству современной пропаганды.
- **Новости**: «Преступность выросла на 50%!» — с 2 до 3 случаев в маленьком районе
- **Реклама**: «9 из 10 врачей рекомендуют» — из специально отобранных 10
- **Политика**: Графики с обрезанной осью Y для драматизации незначительных изменений
Ошибка игрока
Рулетка выпала красное 10 раз подряд. Игрок думает: «Сейчас *точно* будет чёрное - красное уже столько раз было!» Он ставит всё на чёрное... и проигрывает. Это **ошибка игрока** - вера в то, что прошлые случайные события влияют на будущие.
**Gambler's fallacy** (ошибка игрока) - заблуждение, что вероятность случайного события зависит от предыдущих результатов. На самом деле каждый бросок монеты или спин рулетки - *независимое* событие с неизменной вероятностью.
**Обратная ошибка - hot hand fallacy**: «У него серия попаданий, значит он *разогрелся* и будет попадать дальше!» Если события независимы - прошлое не предсказывает будущее.
В семье родилось 4 мальчика подряд. Какова вероятность, что 5-й ребёнок будет девочкой?
Техасский стрелок
Техасец стреляет в амбар, потом рисует мишень вокруг дырок и хвастается: «Смотрите, все попадания в яблочко!» Это **texas sharpshooter fallacy** - находить паттерн в случайных данных *после* того, как вы их увидели.
**Texas sharpshooter fallacy** - выбор или группировка данных *после* их сбора, чтобы создать иллюзию значимого паттерна. Проблема: в любом случайном наборе данных можно найти кластеры, которые выглядят неслучайно.
**Защита:** спрашивайте «Гипотеза была сформулирована ДО или ПОСЛЕ данных?» Научный метод требует: сначала гипотеза, потом проверка. Не наоборот.
Исследователь проанализировал 1000 переменных и нашёл корреляцию между потреблением сыра и количеством запутавшихся в простынях смертей. Это значимо?
Cherry-picking - выборочное цитирование
«Глобальное потепление - миф! Вот исследование, опровергающее его!» - говорит человек, игнорируя сотни исследований, подтверждающих потепление. Это **cherry-picking** - выбор только тех данных, которые поддерживают вашу позицию.
**Cherry-picking** (выборочное цитирование) - выбор только тех данных, примеров или исследований, которые подтверждают желаемый вывод, игнорируя противоречащие. Это манипуляция, даже если каждый отдельный факт верен.
**Защита:** ищите *мета-анализы* и *систематические обзоры* - они анализируют ВСЕ исследования. Спрашивайте: «Это типичный пример или исключение?»
Компания показывает график роста акций с января по март (+30%). При этом за год акции упали на 20%. Это cherry-picking?
Обманчивая статистика
«Средняя зарплата в компании - 100 тысяч». Звучит хорошо! Но если директор получает 900 тысяч, а 9 сотрудников по 11 тысяч, среднее - 100к, а медиана - 11к. **Обманчивая статистика** - когда числа верны, но интерпретация вводит в заблуждение.
**Misleading statistics** - использование статистически верных данных способом, который создаёт ложное впечатление. Включает: путаницу среднего/медианы, манипуляции с базой/шкалой, выбор удобных метрик.
**Правила защиты:** 1. Спросите: среднее или медиана? 2. Смотрите абсолютные числа, не только проценты 3. Проверяйте шкалу графиков 4. Ищите базу сравнения и контекст
Статистика объективна и не может врать
Статистика может быть верной математически, но обманчивой по интерпретации
«Числа не врут, но вруны используют числа» - выбор метрики, периода, визуализации может радикально изменить впечатление при идентичных данных
«Препарат удваивает ваши шансы на выздоровление!» (с 0.5% до 1%). Как правильно интерпретировать?
Ключевые идеи
- **Gambler's fallacy**: прошлые случайные события не влияют на будущие. Монета не имеет памяти
- **Texas sharpshooter**: поиск паттернов после данных создаёт иллюзию. Гипотеза должна быть до данных
- **Cherry-picking**: выбор только поддерживающих данных. Ищите полную картину и мета-анализы
- **Misleading statistics**: среднее vs медиана, относительный vs абсолютный риск, шкала графиков
Связанные темы
Статистические fallacies - о критическом восприятии данных:
- Ошибки двусмысленности — Предыдущая категория - манипуляции словами
- Практика: СМИ — Применение всех fallacies к анализу медиа
Вопросы для размышления
- Какие статистики вы принимали на веру, не проверяя контекст?
- Вспомните случай, когда «впечатляющий процент» оказался незначительным в абсолютных числах
- Как бы вы представили негативную статистику о своей компании, чтобы она выглядела позитивно?