AI-инжиниринг

Будущее: Personal AI - ассистенты которые знают всё о пользователе

Цели урока

Понять разницу между обычным chatbot и Personal AI с полным контекстом
Разобраться в типах памяти: working, episodic, semantic, procedural
Оценить privacy-подходы: local-first, cloud, hybrid, encrypted
Сравнить стратегии Apple, Google и Microsoft в Personal AI
Спроектировать архитектуру Personal AI на базе MCP + local storage

Rewind.ai (теперь Limitless) записывает каждый экран, каждую встречу, каждый разговор - и через секунду отвечает на вопрос «что обсуждали с Сергеем три недели назад». Rabbit R1 провалился именно потому, что пытался дать «умный» ответ без этого контекста. Apple Intelligence пошла другим путём: on-device модель читает Mail, Calendar и Notes - и никакой байт не покидает устройство. Personal AI - это не новая модель, это новый слой: контекст жизни поверх любой LLM.

Rewind / Limitless - total recall: непрерывная запись экрана + мгновенный поиск по всей истории без отправки данных в cloud
Apple Intelligence on-device: ~3B-параметровая модель читает Mail, Calendar, Notes прямо на iPhone - Private Cloud Compute для сложных задач без логов
OpenAI Memory: ChatGPT запоминает факты между сессиями - первый массовый шаг к episodic memory для миллиардов пользователей
Notion AI Personal Context: ассистент знает всю базу знаний команды и черновики конкретного автора - контекст проекта, а не общий интернет

От голосовых ассистентов к Personal AI

Идея персонального цифрового ассистента старше LLM. В 2011 Apple выпустила Siri на iPhone 4S - первый массовый голосовой ассистент, понимающий естественную речь. В 2014 Amazon представила Alexa вместе с колонкой Echo, в 2016 Google выпустила Google Assistant. Эти системы умели ставить таймеры, искать в вебе и управлять умным домом, но контекста о пользователе у них почти не было: каждая команда обрабатывалась изолированно, память между сессиями отсутствовала. С приходом LLM в 2022-2023 видение персонального ассистента вернулось на новом уровне: модель удерживает длинный контекст, рассуждает над документами и перепиской, помнит факты между разговорами. Personal AI 2025 года - это не голосовой триггер, а слой контекста жизни поверх мощной языковой модели.

Предварительные знания

AI с полным контекстом: email, календарь, документы, привычки

ChatGPT, Claude, Gemini - все они начинают каждый разговор с чистого листа. Personal AI - это ассистент, который **знает контекст**: расписание, email-переписку, рабочие документы, предпочтения, историю решений. Rewind.ai превратил эту идею в продукт: total recall всего происходившего на экране, мгновенный поиск по месяцам записей. Разница как между случайным прохожим и помощником, проработавшим рядом 5 лет.

Ключевая идея: **контекст = качество**. Модель одинаковая - Claude или GPT-4o, - но ответ Personal AI на порядок полезнее. Notion AI знает всю базу знаний команды и стиль конкретного автора; GitHub Copilot Workspace знает весь репозиторий и историю PR. Без контекста - это просто автодополнение. С контекстом - партнёр.

Источник контекста	Что даёт AI	Пример
Календарь	Понимание расписания и приоритетов	Автоматический перенос неважных встреч при дедлайне
Email / Slack	Контекст коммуникаций и отношений	"Алексей уже третий раз спрашивает - стоит ответить срочно"
Документы	Знание проектов, решений, архитектуры	Подготовка к встрече на основе проектной документации
Browsing history	Интересы, текущий фокус	Рекомендация статьи по теме, которую изучал вчера
Code / Git	Понимание технического контекста	"В этом PR нарушена конвенция именования из ADR-015"

**Полный контекст - это и полная уязвимость.** AI, который знает email, календарь и привычки - это золотая жила для злоумышленника. Архитектура безопасности Personal AI - одна из сложнейших задач индустрии.

Почему Personal AI даёт значительно более полезные ответы, чем обычный chatbot при использовании той же LLM?

Системы памяти: long-term, episodic, knowledge graph

Человеческая память неоднородна: помним факты (семантическая), события (эпизодическая), навыки (процедурная). Personal AI нуждается в аналогичной **многослойной системе памяти**, а не в одном большом контекстном окне. OpenAI Memory в ChatGPT - первая массовая реализация episodic слоя: факты сохраняются между сессиями и всплывают автоматически. Но это лишь один слой из четырёх.

Тип памяти	Аналог у человека	Реализация в AI	Пример
Working memory	Оперативная память - текущий разговор	Context window (128K-1M tokens)	Текущая задача и её детали
Episodic memory	Воспоминания о событиях	Логи взаимодействий + embedding search	"В прошлый вторник обсуждали миграцию БД"
Semantic memory	Факты и знания	Knowledge graph + vector store	"Проект X использует PostgreSQL 15, деплоится через ArgoCD"
Procedural memory	Навыки, привычки	Learned preferences + action patterns	"При ревью кода всегда проверять error handling первым"

**Knowledge Graph vs Vector Store:** vector store хорош для fuzzy-поиска по семантике ("что-то про миграцию баз данных"). Knowledge graph - для структурированных связей ("кто отвечает за проект X?"). Personal AI нуждается в обоих.

Проблема **memory consolidation**: нельзя хранить каждое сообщение вечно - контекст переполнится. Нужна система «забывания»: важные факты переходят в semantic memory, детали событий - в episodic с decay, рутина - удаляется. Rewind решает это через компрессию: транскрипты сжимаются в embeddings, оригинал хранится локально зашифрованным. Как у человека: помним суть встречи, но не каждое слово.

Personal AI спрашивают: «Что обсуждали с Алексеем на прошлой неделе?». Какой тип памяти использовать?

Privacy: local-first, шифрование, data ownership

Personal AI знает **всё**: переписку, финансы, здоровье, отношения. Если эти данные утекут - последствия катастрофические. Apple Private Cloud Compute сделала ставку на архитектурное решение: сервер обрабатывает запрос и немедленно удаляет данные, каждый узел криптографически верифицируется. Поэтому privacy - не feature, а **фундамент архитектуры**.

Подход	Как работает	Privacy	Качество AI	Примеры
Cloud-first	Все данные на серверах провайдера	Низкая - провайдер видит всё	Максимальное - мощные модели	ChatGPT, Google Gemini
Local-first	Данные и модель на устройстве	Высокая - ничего не уходит	Ограниченное - маленькие модели	Apple Intelligence, Ollama
Hybrid	Чувствительное - локально, остальное - в cloud	Средняя - зависит от реализации	Хорошее - лучшее из двух миров	Apple Private Cloud Compute
Encrypted cloud	Данные в cloud, но зашифрованы. Сервер не видит	Высокая при правильной реализации	Хорошее - мощные модели	Проекты на homomorphic encryption

**Federated Learning** - перспективный подход: модель обучается на данных **локально**, на сервер отправляются только обновления весов (градиенты), не сами данные. Apple применяет это для улучшения клавиатуры QuickType и Siri без доступа к сообщениям. Google использует federated learning в Gboard - модели предсказания следующего слова обучаются на сотнях миллионов устройств, не видя ни одного личного сообщения.

**Data ownership - нерешённая проблема.** Если Personal AI обучен на данных пользователя, кому принадлежит результат? Можно ли "забрать" свои данные при смене провайдера? GDPR и аналогичные законы пока не дают чёткого ответа для AI-систем.

В hybrid privacy архитектуре Personal AI, какие данные должны обрабатываться исключительно on-device?

Apple Intelligence, Google Gemini, Microsoft Copilot - подходы

Три tech-гиганта реализуют Personal AI принципиально по-разному. Apple Intelligence читает Mail/Calendar/Notes on-device и никогда не отправляет их в интернет. Google Gemini получил доступ к 20 годам Gmail-переписки и 1M-token окну - богатейший контекст, но максимальный privacy trade-off. Microsoft Copilot за 30 долларов в месяц на пользователя встроен в каждый Office-документ и Teams-чат корпорации. Каждый подход отражает бизнес-модель - и определяет trade-offs.

Аспект	Apple Intelligence	Google Gemini	Microsoft Copilot
Философия	Privacy-first, on-device	Data-first, cloud-powered	Productivity-first, enterprise
Где модель	On-device (3B) + Private Cloud Compute	Cloud (Gemini Ultra/Pro)	Cloud (GPT-4o + internal models)
Контекст	Локальные данные: Mail, Calendar, Notes, Files	Gmail, Drive, Search history, YouTube, Maps	Office 365: Outlook, Teams, SharePoint, OneDrive
Privacy	Данные не покидают экосистему Apple. PCC - никаких логов	Google видит и использует данные для улучшения моделей	Enterprise compliance: данные в tenant'е компании
Сила	Глубокая OS-интеграция, privacy	Огромный контекст из всех сервисов Google	Бесшовная работа с Office, enterprise features
Слабость	Ограниченная мощность on-device модели	Privacy concerns, зависимость от Google	Привязка к экосистеме Microsoft, стоимость

**Отсутствующий игрок: open-source Personal AI.** Проекты вроде Open Interpreter, PrivateGPT и LocalAI дают возможность построить полностью приватный Personal AI на собственном оборудовании. Качество пока уступает корпоративным решениям, но разрыв сокращается быстро.

Для разработчика интересен вопрос: **можно ли построить Personal AI независимо от tech-гигантов?** PrivateGPT и LocalAI уже позволяют запустить весь стек локально на MacBook Pro M3. Open Interpreter добавляет агентность - AI видит экран, выполняет команды, читает файлы. Ответ - да, и следующий concept покажет как.

В чём главное архитектурное отличие Apple Intelligence от Google Gemini?

Архитектура Personal AI assistant: MCP + local storage

Не обязательно ждать Apple или Google. Уже сегодня собирается Personal AI assistant на базе **MCP (Model Context Protocol)** + локального хранилища + cloud LLM. Anthropic открыл MCP как открытый стандарт - и уже существуют готовые серверы для Google Drive, GitHub, Slack, PostgreSQL, браузера. Claude Desktop поддерживает MCP нативно и может читать локальные файлы через него же.

**LLM**: Claude API / GPT-4o (cloud) или Llama 3.1 70B через Ollama (local)
**MCP серверы**: @modelcontextprotocol/servers - готовые серверы для файлов, Git, баз данных, браузера
**Vector store**: ChromaDB (local) или Qdrant (self-hosted) - для episodic memory
**Knowledge graph**: SQLite + json (простой) или Neo4j (полноценный) - для semantic memory
**Local storage**: Encrypted SQLite для preferences и procedural memory
**Orchestration**: LangGraph или custom agent loop - для multi-step задач

**Начать стоит с малого:** один MCP-сервер (например, файловая система) + vector store для памяти + Claude API. Это уже даёт 80% value Personal AI. Потом постепенно подключаются calendar, email, Git и другие источники.

Какую роль играет MCP (Model Context Protocol) в архитектуре Personal AI?

Итоги

Personal AI = любая LLM + контекст жизни. Модель вторична - первичен контекст
Четыре слоя памяти: working (текущий разговор в промпте), episodic (события - Qdrant/Pinecone), semantic (факты - knowledge graph), procedural (паттерны - preferences store)
Privacy-маршрутизация: критически чувствительное (здоровье, финансы) - только on-device; рабочие документы - E2E-encrypted cloud; общие вопросы - мощный cloud
Apple жертвует мощностью ради privacy (on-device ~3B), Google жертвует privacy ради контекста (1M-token window из Gmail+Drive+Maps), Microsoft - enterprise compliance за 30 долларов в месяц на пользователя
Минимальный рабочий Personal AI: один MCP-сервер (файловая система) + ChromaDB + Claude API - уже даёт 80% value, масштабируется постепенно

Что дальше

Personal AI - это ассистент внутри существующей системы. Но что если AI станет самой системой? Следующий урок - о будущем, где AI становится операционной системой, а natural language заменяет GUI.

AI как операционная система — От Personal AI к AI OS - когда ассистент становится интерфейсом ко всему компьютеру
AI экономика — Personal AI создаёт новые бизнес-модели и роли - экономический контекст

Связанные уроки

aie-15-conversation-memory — Personal AI расширяет память диалога на жизненный контекст
aie-47-autonomous-agents — Проактивные действия требуют автономных циклов
aie-45-mcp-protocol — MCP подключает personal AI к локальным инструментам
aie-41-knowledge-graphs — Эпизодическая память использует структуры графов знаний
net-44-zero-trust — Local-first приватность повторяет zero-trust границы данных
sd-10-microservices