Data Science

Storytelling с данными

2006 год, TED. Hans Rosling выходит к экрану и показывает три анимированных пузырьковых графика. За 15 минут он переворачивает представление мировой аудитории о развивающихся странах: 'Швеция и Бангладеш сегодня - это Швеция 1970 и Швеция 1900, но не разный мир'. Те же данные ВОЗ висели в открытом доступе годами. Они меняли решения только когда Rosling придал им нарратив.

  • **Spotify Wrapped**: ежегодная подборка персональной статистики прослушиваний стала вирусной не из-за данных (они скучны), а из-за storytelling-обёртки: герой (ты), конфликт (топ-жанр неожидан), резолюция (твой год в музыке)
  • **FiveThirtyEight и The Pudding**: журналисты данных переизобрели жанр, переключившись с 'таблиц и графиков' на нарративные дата-эссе - 1 миллион просмотров на статью про экономику Hollywood
  • **Internal McKinsey & BCG decks**: pyramid principle и MECE-структура слайдов настолько кодифицированы, что новички тренируются 6 месяцев именно на storytelling, не на анализе

Структура нарратива

Hans Rosling в 2006 году на TED-конференции с помощью трёх анимированных пузырьковых графиков перевернул представление мировой аудитории о развивающихся странах. Та же статистика ВОЗ висела в открытом доступе годами - и не двигала никого. Разница - не в данных, а в нарративе. Cole Nussbaumer Knaflic формализовала это в 'Storytelling with Data': факт без структуры остаётся фоновым шумом. Любая презентация результата ML-модели или A/B теста должна иметь three-act structure: setup (контекст и проблема), conflict (что обнаружили, что неожиданно), resolution (решение и call to action).

  1. **Setup**: 'Конверсия checkout упала на 8% за квартал' - что наблюдаем и почему это важно сейчас
  2. **Conflict**: 'Падение сконцентрировано в десктоп-сегменте Chrome 119+; мобайл и Safari стабильны' - неожиданное открытие, ломающее очевидную гипотезу
  3. **Resolution**: 'Гипотеза - regression в обновлении checkout.js от 12 окт; предлагаю откатить релиз и провести A/B test исправления' - конкретное действие с измеримым результатом

Anti-pattern: data dump. Презентация из 25 слайдов с дашбордами не имеет нарратива - аудитория увидит цифры, но не запомнит вывод. Правило McKinsey 'Pyramid principle' - начать с ответа, затем 3 supporting points, затем доказательства. Слушатели уровня C-suite принимают решение в первые 60 секунд, остальное - подкрепление или сомнение. Слайды без headline-вывода - провал коммуникации.

Аналитик показывает CFO результаты квартального анализа когорт. Как лучше структурировать первый слайд?

Выбор типа графика

Тип графика определяется не данными, а вопросом, на который график должен ответить. Andrew Abela в матрице 'Chart Chooser' выделил 4 фундаментальных типа сравнения: composition (часть от целого), comparison (между категориями или во времени), distribution (как разбросаны значения), relationship (как связаны переменные). Большинство ошибок в выборе графика - это композиционные данные, поданные через bar chart, или временной ряд в pie chart.

Принципы pre-attentive processing: мозг обрабатывает за 250 мс позицию, длину, цвет, размер - в этом порядке точности. Position (scatter plot) даёт самое точное сравнение, length (bar) - тоже надёжно, angle/area (pie) - заметно хуже (исследования Cleveland & McGill, 1984). Поэтому pie chart годится только для 2-3 категорий, и любое сравнение долей лучше делать через горизонтальный bar.

PM просит показать, как меняется доля 5 источников трафика за 12 месяцев. Какой тип графика лучший выбор?

Дизайн дашбордов

Дашборд - не место для всех возможных метрик. Stephen Few в 'Information Dashboard Design' определил его строго: 'single screen, persistent display of the most important information needed to achieve goals, consolidated and arranged for at-a-glance monitoring'. Ключевые элементы: (1) one screen без скролла, (2) 4-9 ключевых метрик максимум (Miller's law о ёмкости рабочей памяти), (3) F-pattern или Z-pattern размещения - самое важное в верхнем левом углу.

Уровни дашбордов: Strategic (CEO, недельно) - 5-7 KPIs верхнего уровня, тренды квартал/год; Operational (PM, ежедневно) - метрики продукта, drill-down до сегментов; Analytical (data team, по запросу) - hypothesis exploration. Главная ошибка - mixing levels на одном экране: KPI вроде MAU нельзя сочетать с распределением p99 latency, у них разная аудитория и каденс обновления.

  • **Сигнал vs шум**: убрать gridlines, легенды дублирующие подписи, 3D-эффекты, ненужные decorations
  • **Цвет нагружен**: серый = базовый, цвет = акцент только для аномалий. Светофор red/yellow/green только при наличии порогов
  • **Контекст рядом с числом**: '142 заказа' - бесполезно, '142 заказа (+18% WoW, цель: 150)' - решающее
  • **Targeted summary**: SLO target и текущее значение в одной строке - не нужно два отдельных виджета
  • **Update timestamp**: каждый дашборд должен показывать, когда обновлялись данные. Stale dashboards - источник плохих решений

В компании создан 'единый дашборд' с 25 виджетами на трёх экранах: KPI верхнего уровня, p95 latency сервисов, A/B тест результаты, финансовые метрики. Какое главное замечание?

Презентация результатов

Презентация ML-результата стейкхолдерам - отдельный навык. Технические лиды совершают типичную ошибку: показывают confusion matrix, ROC AUC, hyperparameter search trajectory. Бизнес-аудитория видит шум и теряет интерес за 90 секунд. Edward Tufte: 'Above all else show the data' - но 'данные' для CEO и для ML-инженера разные. Для CEO data = долларовый impact, для PM = retention/conversion delta, для DS = метрика модели.

Шаблон бизнес-презентации ML-проекта: (1) Один слайд problem framing - какую дыру в воронке закрываем; (2) Один слайд approach без деталей моделей - 'обучили классификатор на 6 месяцах транзакций'; (3) Один слайд результат в долларах - 'снижение fraud loss на $1.2M/год при тех же false positive'; (4) Один слайд риски - 'требуется ежеквартальное обучение на новых данных, monitoring drift'; (5) Один слайд roadmap - что дальше. Технические детали - в appendix для технической аудитории.

Качество презентации зависит от красоты слайдов и анимаций

Качество презентации зависит от ясности нарратива и совпадения языка с аудиторией

Edward Tufte изучал презентации NASA до катастрофы Challenger: 14 слайдов с decoration скрыли критический риск. PowerPoint-шум не спасает плохую структуру, а отвлекает от хорошей. Принцип data-ink ratio: минимум графики, максимум данных и нарратива.

DS-команда представляет CEO модель churn prediction с AUC=0.84 и F1=0.71. CEO задаёт вопрос: 'Что это значит для нас?'. Какой ответ лучший?

Ключевые идеи

  • **Нарратив** структурирует данные через three-act: setup -> conflict -> resolution. Без нарратива даже сильные данные превращаются в data dump
  • **Тип графика** определяется вопросом, а не данными: composition, comparison, distribution, relationship - матрица Abela помогает не ошибиться
  • **Дашборд** - single screen для одной аудитории, 4-9 ключевых метрик, без mixing levels. Цвет нагружен значением, серый - базовый
  • **Презентация ML** требует перевода метрик в бизнес-impact (доллары, retention, NPS) - AUC и F1 для technical appendix, а не для CEO-слайда

Связанные темы

Hans Rosling из вступления не открывал новых данных - он перерисовывал известную статистику. Это показывает: communication часто важнее анализа. Storytelling замыкает цикл data science от raw data к решениям и связан с несколькими этапами пайплайна:

  • EDA и визуализация — EDA-графики для аналитика - черновики; storytelling-графики для презентации - финальная редакция тех же данных с другой целью
  • A/B тестирование — Результаты тестов почти всегда подаются менеджменту через storytelling: 'lift на 2.3% значит +$X выручки' - не 'p-value=0.04'
  • ML в продукте — Модели становятся реальностью только когда команда понимает их impact. Презентация ML-результатов - финальный шаг от R&D к production

Вопросы для размышления

  • Rosling использовал анимацию (изменение во времени), и это работало на TED. На корпоративной презентации анимированные графики часто раздражают. В чём разница контекстов?
  • Команда продукта попросила 'дашборд со всеми метриками'. Почему такая просьба - red flag, и как переформулировать её, чтобы получился полезный артефакт?
  • Если CEO даст 30 секунд на вашу презентацию ML-модели, какие три предложения вы скажете? Какие компромиссы делаете между технической точностью и понятностью?

Связанные уроки

  • ds-12 — Causal inference дает честные истории - без него корреляция врет
  • ds-14 — Продвинутая визуализация - следующий шаг после нарратива
  • ml-05-evaluation — Метрики - сырой материал для data storytelling
  • prob-08-variance — Дисперсия объясняет погрешность в историях о данных
  • stat-08-correlation
Storytelling с данными

0

1

Войти