Машинное обучение

Что такое машинное обучение

Каждый раз, когда Netflix рекомендует фильм, Google переводит текст или банк блокирует подозрительную транзакцию за миллисекунды - за этим стоит машинное обучение. Но что на самом деле означает, что компьютер «учится»? Ведь у него нет мозга, нет опыта, нет интуиции. И чем это отличается от обычного программирования, где человек пишет каждое правило вручную?

**Google Translate** обрабатывает 100+ млрд слов ежедневно на 130 языках - и качество перевода за 10 лет выросло больше, чем за предыдущие 50 лет правил, написанных лингвистами вручную
**Fraud detection** в банках анализирует каждую транзакцию за 50 мс, выявляя мошенничество с точностью 99.5% - спасая от потерь 30+ млрд в год по всему миру
**AlphaFold** от DeepMind решила 50-летнюю проблему биологии - предсказание 3D-структуры белка по его аминокислотной последовательности - за минуты вместо месяцев лабораторных экспериментов

Артур Сэмюэл вводит термин

Само словосочетание «machine learning» восходит к Артуру Сэмюэлу, инженеру IBM, который в 1959 году написал программу для игры в шашки. Она играла сама с собой тысячи партий и в итоге начала обыгрывать своего создателя; стратегию Сэмюэл не программировал, программа вывела её из опыта. Фундамент заложили раньше: в 1950 году Алан Тьюринг в работе «Computing Machinery and Intelligence» поставил вопрос, способна ли машина мыслить, и предложил то, что сегодня называют тестом Тьюринга, а в 1958 году Фрэнк Розенблатт представил перцептрон, первую модель, которая училась распознавать образы, подстраивая собственные веса. Эти три идеи (определение обучения, тест на интеллект и обучаемая модель) задали программу всего, что было дальше.

Определение машинного обучения

В 1959 году Артур Сэмюэль, инженер IBM, дал определение, которое используют до сих пор: **Machine Learning - это область исследований, которая даёт компьютерам способность учиться без явного программирования.** Сэмюэль написал программу для игры в шашки, которая играла сама с собой тысячи раз и со временем стала обыгрывать своего создателя. Он не программировал стратегию - программа *нашла* её сама.

В 1997 году Том Митчелл формализовал это определение строже: *«Компьютерная программа учится на опыте E по отношению к задаче T и метрике качества P, если её производительность при решении T, измеренная P, улучшается с ростом опыта E.»* Звучит академично, но суть проста: программа **улучшается с практикой**, как человек.

**Пример по Митчеллу:** спам-фильтр Gmail. - **Задача T:** классифицировать письмо как спам или не спам - **Опыт E:** миллионы писем, размеченных пользователями (кнопка «Это спам») - **Метрика P:** процент правильно классифицированных писем Чем больше писем размечено - тем точнее фильтр. Это и есть «обучение».

Что значит «обучение» математически? ML ищет **функцию f(x) -> y**, которая по входным данным x предсказывает правильный ответ y. Обучение - это процесс поиска такой функции f, которая **минимизирует ошибку** на имеющихся данных. Если функция ошибается - алгоритм корректирует её параметры и пробует снова.

**Теорема «No Free Lunch» (Уолперт, 1996):** не существует единого алгоритма ML, который был бы лучшим для *всех* задач. Алгоритм, идеально работающий на распознавании лиц, может быть бесполезен для предсказания цен акций. Выбор подхода всегда зависит от данных и задачи.

Чем принципиально отличается ML от традиционного программирования?

История ML: от перцептрона до deep learning

История ML - это не плавный прогресс, а **серия прорывов, разочарований и возрождений**. Дважды область переживала «зимы AI» - периоды, когда финансирование исчезало, а исследователи уходили. И дважды появлялись новые идеи, которые возвращали её к жизни.

В **1943 году** Уоррен Маккаллок и Уолтер Питтс предложили математическую модель нейрона - простую функцию, принимающую несколько входов и выдающую один выход. В **1957** Фрэнк Розенблатт построил **перцептрон** - первую машину, способную *обучаться* распознавать образы. New York Times писала: «Эмбрион электронного компьютера, который, как ожидается, сможет ходить, говорить, видеть и... осознавать своё существование».

Но в **1969** году Марвин Минский и Сеймур Пейперт опубликовали книгу *«Perceptrons»*, математически доказав, что однослойный перцептрон не может решить даже задачу XOR (исключающее ИЛИ). Это вызвало **первую зиму AI**: финансирование нейросетей иссякло, исследователи ушли в другие области.

Возрождение пришло в **1986**: Румельхарт, Хинтон и Уильямс опубликовали метод **обратного распространения ошибки (backpropagation)**, позволивший обучать *многослойные* сети. Но мощностей компьютеров 80-х не хватало, и наступила **вторая зима**. Переломный момент - **2012 год**: нейросеть AlexNet выиграла конкурс ImageNet по распознаванию изображений, снизив ошибку с 26% до 15.3%. Это запустило революцию **deep learning**, которая продолжается до сих пор.

**Три фактора, изменивших всё после 2012:** 1. **Данные** - интернет сгенерировал петабайты размеченных данных (ImageNet - 14 млн изображений) 2. **Вычисления** - GPU (видеокарты) оказались идеальны для матричных операций нейросетей 3. **Алгоритмы** - dropout, batch normalization, residual connections решили проблемы обучения глубоких сетей Bez сочетания всех трёх факторов deep learning не состоялся бы.

В **2017** команда Google опубликовала статью *«Attention Is All You Need»*, представив архитектуру **Transformer**. Эта архитектура стала основой GPT, BERT, Claude и всех современных языковых моделей. В **2022** выход ChatGPT сделал ML массовым явлением: за 2 месяца продукт набрал 100 млн пользователей - быстрее любого приложения в истории.

Почему после публикации книги Минского и Пейперта «Perceptrons» (1969) наступила первая «зима AI»?

Применения ML в реальном мире

Сегодня ML - не экспериментальная технология, а **основа продуктов, которыми пользуются миллиарды людей**. Каждый раз, когда вы открываете ленту в соцсетях, ищете что-то в Google или получаете рекомендацию на Netflix - за этим стоит ML-модель, обученная на петабайтах данных.

**Компьютерное зрение (Computer Vision):** в 2020 году ML-модель от Google Health обнаруживала рак молочной железы на маммограммах точнее, чем врачи-радиологи - на **11.5%** меньше ложноотрицательных результатов. Tesla Autopilot обрабатывает 8 камер одновременно, анализируя дорожную обстановку 36 раз в секунду. А Face ID в iPhone использует нейросеть, которая работает даже если вы отрастили бороду или надели очки.

**Рекомендательные системы** генерируют огромную долю выручки крупнейших компаний. Netflix оценивает, что их рекомендации приносят **1 млрд в год** (удержание подписчиков). YouTube: **70%** просмотренного контента приходит из рекомендаций. Spotify Discover Weekly анализирует поведение 600+ млн пользователей, чтобы каждый понедельник создать персональный плейлист из 30 треков.

**ML в повседневной жизни (вы уже используете, не замечая):** - **Клавиатура смартфона** - предсказывает следующее слово (языковая модель) - **Google Maps** - предсказывает время в пути на основе данных миллионов водителей - **Банковское приложение** - блокирует подозрительную транзакцию за 50 мс - **Shazam** - распознаёт песню по 10-секундному отрывку среди 100+ млн треков - **Медицина** - AlphaFold от DeepMind предсказал структуру 200+ млн белков, ускорив разработку лекарств на годы

ML/AI скоро заменит всех программистов и большинство профессий

ML автоматизирует рутинные задачи, но требует людей для постановки задач, подготовки данных, интерпретации результатов и этического контроля

ML-модели работают в узких доменах (narrow AI), не обладают общим интеллектом (AGI), и качество их работы критически зависит от данных и постановки задачи человеком

Какое утверждение верно о соотношении AI, ML и Deep Learning?

Ключевые идеи

**Суть ML:** вместо ручного написания правил алгоритм сам извлекает закономерности из данных (данные + ответы = модель)
**История ML** - это 80 лет прорывов и «зим AI»: от перцептрона (1957) через backpropagation (1986) и AlexNet (2012) к Transformer и ChatGPT
**AI, ML, Deep Learning** - вложенные множества: каждый DL - это ML, каждый ML - это AI, но не наоборот
**ML уже везде:** от клавиатуры смартфона до диагностики рака - именно поэтому Netflix точно рекомендует фильмы, а банк блокирует подозрительные транзакции за миллисекунды, как мы обсуждали в начале

Связанные темы

Машинное обучение - обширная область, и этот урок лишь вводит основные понятия. Дальше разберёмся в типах обучения, математических основах и первых алгоритмах:

Типы машинного обучения — Supervised, unsupervised, reinforcement learning - три парадигмы с разными подходами к данным и задачам
Математические основы ML — Линейная алгебра, теория вероятностей и оптимизация - математический фундамент, на котором строятся все алгоритмы
Линейная регрессия — Первый алгоритм ML на практике - самый простой способ найти функцию f(x) → y и понять, как работает обучение

Вопросы для размышления

Если ML-модель обучена на данных прошлого, может ли она предсказать принципиально новые явления? В чём ограничение подхода «учиться на опыте»?
Какие этические проблемы возникают, когда ML-модель принимает решения о людях - например, одобрение кредита или приём на работу?
Почему ML «выстрелил» именно в 2010-х, хотя основные идеи (нейросети, backpropagation) существовали с 1980-х?

Связанные уроки

ml-02-types — Следующий шаг: типы обучения (supervised, unsupervised, RL)
prob-01-intro — Вероятности и распределения - язык ML
la-01-vectors-intro — Векторы и матрицы - математика признаков и весов
stat-01-sampling — Выборки и оценка - как ML работает с данными
aie-01-ai-for-backend-dev — Как применять ML-модели в реальных системах
st-01-feedback-loops — Петля обратной связи как архетип обучения