AI-инжиниринг
Будущее: Personal AI - ассистенты которые знают всё о пользователе
Цели урока
- Понять разницу между обычным chatbot и Personal AI с полным контекстом
- Разобраться в типах памяти: working, episodic, semantic, procedural
- Оценить privacy-подходы: local-first, cloud, hybrid, encrypted
- Сравнить стратегии Apple, Google и Microsoft в Personal AI
- Спроектировать архитектуру Personal AI на базе MCP + local storage
Rewind.ai (теперь Limitless) записывает каждый экран, каждую встречу, каждый разговор - и через секунду отвечает на вопрос «что обсуждали с Сергеем три недели назад». Rabbit R1 провалился именно потому, что пытался дать «умный» ответ без этого контекста. Apple Intelligence пошла другим путём: on-device модель читает Mail, Calendar и Notes - и никакой байт не покидает устройство. Personal AI - это не новая модель, это новый слой: контекст жизни поверх любой LLM.
- Rewind / Limitless - total recall: непрерывная запись экрана + мгновенный поиск по всей истории без отправки данных в cloud
- Apple Intelligence on-device: ~3B-параметровая модель читает Mail, Calendar, Notes прямо на iPhone - Private Cloud Compute для сложных задач без логов
- OpenAI Memory: ChatGPT запоминает факты между сессиями - первый массовый шаг к episodic memory для миллиардов пользователей
- Notion AI Personal Context: ассистент знает всю базу знаний команды и черновики конкретного автора - контекст проекта, а не общий интернет
От голосовых ассистентов к Personal AI
Идея персонального цифрового ассистента старше LLM. В 2011 Apple выпустила Siri на iPhone 4S - первый массовый голосовой ассистент, понимающий естественную речь. В 2014 Amazon представила Alexa вместе с колонкой Echo, в 2016 Google выпустила Google Assistant. Эти системы умели ставить таймеры, искать в вебе и управлять умным домом, но контекста о пользователе у них почти не было: каждая команда обрабатывалась изолированно, память между сессиями отсутствовала. С приходом LLM в 2022-2023 видение персонального ассистента вернулось на новом уровне: модель удерживает длинный контекст, рассуждает над документами и перепиской, помнит факты между разговорами. Personal AI 2025 года - это не голосовой триггер, а слой контекста жизни поверх мощной языковой модели.
Предварительные знания
AI с полным контекстом: email, календарь, документы, привычки
ChatGPT, Claude, Gemini - все они начинают каждый разговор с чистого листа. Personal AI - это ассистент, который **знает контекст**: расписание, email-переписку, рабочие документы, предпочтения, историю решений. Rewind.ai превратил эту идею в продукт: total recall всего происходившего на экране, мгновенный поиск по месяцам записей. Разница как между случайным прохожим и помощником, проработавшим рядом 5 лет.
Ключевая идея: **контекст = качество**. Модель одинаковая - Claude или GPT-4o, - но ответ Personal AI на порядок полезнее. Notion AI знает всю базу знаний команды и стиль конкретного автора; GitHub Copilot Workspace знает весь репозиторий и историю PR. Без контекста - это просто автодополнение. С контекстом - партнёр.
| Источник контекста | Что даёт AI | Пример |
|---|---|---|
| Календарь | Понимание расписания и приоритетов | Автоматический перенос неважных встреч при дедлайне |
| Email / Slack | Контекст коммуникаций и отношений | "Алексей уже третий раз спрашивает - стоит ответить срочно" |
| Документы | Знание проектов, решений, архитектуры | Подготовка к встрече на основе проектной документации |
| Browsing history | Интересы, текущий фокус | Рекомендация статьи по теме, которую изучал вчера |
| Code / Git | Понимание технического контекста | "В этом PR нарушена конвенция именования из ADR-015" |
**Полный контекст - это и полная уязвимость.** AI, который знает email, календарь и привычки - это золотая жила для злоумышленника. Архитектура безопасности Personal AI - одна из сложнейших задач индустрии.
Почему Personal AI даёт значительно более полезные ответы, чем обычный chatbot при использовании той же LLM?
Системы памяти: long-term, episodic, knowledge graph
Человеческая память неоднородна: помним факты (семантическая), события (эпизодическая), навыки (процедурная). Personal AI нуждается в аналогичной **многослойной системе памяти**, а не в одном большом контекстном окне. OpenAI Memory в ChatGPT - первая массовая реализация episodic слоя: факты сохраняются между сессиями и всплывают автоматически. Но это лишь один слой из четырёх.
| Тип памяти | Аналог у человека | Реализация в AI | Пример |
|---|---|---|---|
| Working memory | Оперативная память - текущий разговор | Context window (128K-1M tokens) | Текущая задача и её детали |
| Episodic memory | Воспоминания о событиях | Логи взаимодействий + embedding search | "В прошлый вторник обсуждали миграцию БД" |
| Semantic memory | Факты и знания | Knowledge graph + vector store | "Проект X использует PostgreSQL 15, деплоится через ArgoCD" |
| Procedural memory | Навыки, привычки | Learned preferences + action patterns | "При ревью кода всегда проверять error handling первым" |
**Knowledge Graph vs Vector Store:** vector store хорош для fuzzy-поиска по семантике ("что-то про миграцию баз данных"). Knowledge graph - для структурированных связей ("кто отвечает за проект X?"). Personal AI нуждается в обоих.
Проблема **memory consolidation**: нельзя хранить каждое сообщение вечно - контекст переполнится. Нужна система «забывания»: важные факты переходят в semantic memory, детали событий - в episodic с decay, рутина - удаляется. Rewind решает это через компрессию: транскрипты сжимаются в embeddings, оригинал хранится локально зашифрованным. Как у человека: помним суть встречи, но не каждое слово.
Personal AI спрашивают: «Что обсуждали с Алексеем на прошлой неделе?». Какой тип памяти использовать?
Privacy: local-first, шифрование, data ownership
Personal AI знает **всё**: переписку, финансы, здоровье, отношения. Если эти данные утекут - последствия катастрофические. Apple Private Cloud Compute сделала ставку на архитектурное решение: сервер обрабатывает запрос и немедленно удаляет данные, каждый узел криптографически верифицируется. Поэтому privacy - не feature, а **фундамент архитектуры**.
| Подход | Как работает | Privacy | Качество AI | Примеры |
|---|---|---|---|---|
| Cloud-first | Все данные на серверах провайдера | Низкая - провайдер видит всё | Максимальное - мощные модели | ChatGPT, Google Gemini |
| Local-first | Данные и модель на устройстве | Высокая - ничего не уходит | Ограниченное - маленькие модели | Apple Intelligence, Ollama |
| Hybrid | Чувствительное - локально, остальное - в cloud | Средняя - зависит от реализации | Хорошее - лучшее из двух миров | Apple Private Cloud Compute |
| Encrypted cloud | Данные в cloud, но зашифрованы. Сервер не видит | Высокая при правильной реализации | Хорошее - мощные модели | Проекты на homomorphic encryption |
**Federated Learning** - перспективный подход: модель обучается на данных **локально**, на сервер отправляются только обновления весов (градиенты), не сами данные. Apple применяет это для улучшения клавиатуры QuickType и Siri без доступа к сообщениям. Google использует federated learning в Gboard - модели предсказания следующего слова обучаются на сотнях миллионов устройств, не видя ни одного личного сообщения.
**Data ownership - нерешённая проблема.** Если Personal AI обучен на данных пользователя, кому принадлежит результат? Можно ли "забрать" свои данные при смене провайдера? GDPR и аналогичные законы пока не дают чёткого ответа для AI-систем.
В hybrid privacy архитектуре Personal AI, какие данные должны обрабатываться исключительно on-device?
Apple Intelligence, Google Gemini, Microsoft Copilot - подходы
Три tech-гиганта реализуют Personal AI принципиально по-разному. Apple Intelligence читает Mail/Calendar/Notes on-device и никогда не отправляет их в интернет. Google Gemini получил доступ к 20 годам Gmail-переписки и 1M-token окну - богатейший контекст, но максимальный privacy trade-off. Microsoft Copilot за 30 долларов в месяц на пользователя встроен в каждый Office-документ и Teams-чат корпорации. Каждый подход отражает бизнес-модель - и определяет trade-offs.
| Аспект | Apple Intelligence | Google Gemini | Microsoft Copilot |
|---|---|---|---|
| Философия | Privacy-first, on-device | Data-first, cloud-powered | Productivity-first, enterprise |
| Где модель | On-device (3B) + Private Cloud Compute | Cloud (Gemini Ultra/Pro) | Cloud (GPT-4o + internal models) |
| Контекст | Локальные данные: Mail, Calendar, Notes, Files | Gmail, Drive, Search history, YouTube, Maps | Office 365: Outlook, Teams, SharePoint, OneDrive |
| Privacy | Данные не покидают экосистему Apple. PCC - никаких логов | Google видит и использует данные для улучшения моделей | Enterprise compliance: данные в tenant'е компании |
| Сила | Глубокая OS-интеграция, privacy | Огромный контекст из всех сервисов Google | Бесшовная работа с Office, enterprise features |
| Слабость | Ограниченная мощность on-device модели | Privacy concerns, зависимость от Google | Привязка к экосистеме Microsoft, стоимость |
**Отсутствующий игрок: open-source Personal AI.** Проекты вроде Open Interpreter, PrivateGPT и LocalAI дают возможность построить полностью приватный Personal AI на собственном оборудовании. Качество пока уступает корпоративным решениям, но разрыв сокращается быстро.
Для разработчика интересен вопрос: **можно ли построить Personal AI независимо от tech-гигантов?** PrivateGPT и LocalAI уже позволяют запустить весь стек локально на MacBook Pro M3. Open Interpreter добавляет агентность - AI видит экран, выполняет команды, читает файлы. Ответ - да, и следующий concept покажет как.
В чём главное архитектурное отличие Apple Intelligence от Google Gemini?
Архитектура Personal AI assistant: MCP + local storage
Не обязательно ждать Apple или Google. Уже сегодня собирается Personal AI assistant на базе **MCP (Model Context Protocol)** + локального хранилища + cloud LLM. Anthropic открыл MCP как открытый стандарт - и уже существуют готовые серверы для Google Drive, GitHub, Slack, PostgreSQL, браузера. Claude Desktop поддерживает MCP нативно и может читать локальные файлы через него же.
- **LLM**: Claude API / GPT-4o (cloud) или Llama 3.1 70B через Ollama (local)
- **MCP серверы**: @modelcontextprotocol/servers - готовые серверы для файлов, Git, баз данных, браузера
- **Vector store**: ChromaDB (local) или Qdrant (self-hosted) - для episodic memory
- **Knowledge graph**: SQLite + json (простой) или Neo4j (полноценный) - для semantic memory
- **Local storage**: Encrypted SQLite для preferences и procedural memory
- **Orchestration**: LangGraph или custom agent loop - для multi-step задач
**Начать стоит с малого:** один MCP-сервер (например, файловая система) + vector store для памяти + Claude API. Это уже даёт 80% value Personal AI. Потом постепенно подключаются calendar, email, Git и другие источники.
Какую роль играет MCP (Model Context Protocol) в архитектуре Personal AI?
Итоги
- Personal AI = любая LLM + контекст жизни. Модель вторична - первичен контекст
- Четыре слоя памяти: working (текущий разговор в промпте), episodic (события - Qdrant/Pinecone), semantic (факты - knowledge graph), procedural (паттерны - preferences store)
- Privacy-маршрутизация: критически чувствительное (здоровье, финансы) - только on-device; рабочие документы - E2E-encrypted cloud; общие вопросы - мощный cloud
- Apple жертвует мощностью ради privacy (on-device ~3B), Google жертвует privacy ради контекста (1M-token window из Gmail+Drive+Maps), Microsoft - enterprise compliance за 30 долларов в месяц на пользователя
- Минимальный рабочий Personal AI: один MCP-сервер (файловая система) + ChromaDB + Claude API - уже даёт 80% value, масштабируется постепенно
Что дальше
Personal AI - это ассистент внутри существующей системы. Но что если AI станет самой системой? Следующий урок - о будущем, где AI становится операционной системой, а natural language заменяет GUI.
- AI как операционная система — От Personal AI к AI OS - когда ассистент становится интерфейсом ко всему компьютеру
- AI экономика — Personal AI создаёт новые бизнес-модели и роли - экономический контекст
Связанные уроки
- aie-15-conversation-memory — Personal AI расширяет память диалога на жизненный контекст
- aie-47-autonomous-agents — Проактивные действия требуют автономных циклов
- aie-45-mcp-protocol — MCP подключает personal AI к локальным инструментам
- aie-41-knowledge-graphs — Эпизодическая память использует структуры графов знаний
- net-44-zero-trust — Local-first приватность повторяет zero-trust границы данных
- sd-10-microservices