Автоматы и сознание
Когнитивные архитектуры
Цели урока
- Понять принципы SOAR: problem space, impasse, chunking как онлайн-обучение
- Освоить математические основы ACT-R: активация, retrieval time, power law of forgetting
- Разобрать LIDA: conscious broadcast как механизм внимания
- Сравнить архитектуры и увидеть их идеи в современных LLM-агентах
Предварительные знания
- Global Workspace Theory (урок 11)
- Базовое понимание продукционных систем IF-THEN
- Знакомство с нейронными сетями на уровне интуиции
SOAR управлял истребителем в 1995. ACT-R предсказывает fMRI паттерны. LIDA реализует GWT инженерно. Всё это - до LLM. Современные агенты переизобретают эти идеи с нуля.
- TacAir-Soar (1995): SOAR управлял виртуальным F-16 в симуляторах ВВС США
- ACT-R (2004): модель воспроизвела паттерны fMRI при математических задачах с точностью до участка мозга
- LIDA используется для моделирования внимания и нарушений сознания в нейронауке
- ReAct, AutoGPT, LangGraph: неявно переизобретают SOAR (planning) и ACT-R (memory)
- Transformer attention - частичная реализация GWT, но без явного winner-take-all
Три пути к общему интеллекту
Аллен Ньюэлл и Джон Лэрд создали SOAR в 1983 как попытку реализовать 'unified theory of cognition' из книги Ньюэлла. Джон Андерсон разработал ACT-R в 1993, делая упор на математическую точность и предсказание поведения. Стэн Франклин создал LIDA в 2005, интегрируя GWT. Все трое работали параллельно - разные взгляды на одну задачу.
SOAR: обучение через тупики
**1995 год. TacAir-Soar управляет виртуальным истребителем F-16 в авиасимуляторе ВВС США. Система летит, уклоняется от ракет, атакует цели - и самообучается в процессе.** Не нейронная сеть, не LLM. Продукционная система с 50 тысячами правил IF-THEN, которая при каждом новом тупике создаёт новое правило через механизм chunking. Это SOAR - State, Operator And Result.
**SOAR** - проблемно-ориентированная архитектура Аллена Ньюэлла и Джона Лэрда (1983). Всё познание - движение по problem space: текущее состояние + оператор = новое состояние. При невозможности выбрать оператор возникает impasse, создаётся подцель, и после разрешения - новое правило (chunk). Chunking = компиляция опыта.
Три типа памяти и основной цикл
| Память | Содержимое | Аналог в LLM |
|---|---|---|
| Procedural (LTM) | Production rules: IF conditions THEN actions | Веса модели |
| Semantic (LTM) | Факты о мире | Предобученные знания |
| Episodic (LTM) | Воспоминания о событиях | История диалога |
| Working Memory | Текущее состояние (фокус) | Context window |
SOAR - устаревший символьный AI, несовместимый с нейросетями
Идеи SOAR (chunking, impasse, memory types) прямо влияют на архитектуру современных LLM-агентов
Working Memory = context window, Procedural = веса, Episodic = история. Chunking аналогичен in-context learning. Разница: SOAR явно моделирует эти компоненты, LLM делает это неявно в параметрах.
В чём разница между Elaboration и Decision фазами SOAR?
ACT-R: математика человеческой памяти
**ACT-R (Adaptive Control of Thought - Rational) делает то, что не умеет ни одна нейросеть: предсказывает время реакции человека с точностью до миллисекунд.** В 2004 году модель ACT-R точно воспроизвела паттерны fMRI при решении математических задач - до конкретных участков мозга. Джон Андерсон создал не просто архитектуру AI, а формальную модель человеческого познания.
**Центральный bottleneck ACT-R**: только ОДИН production rule может выполняться за цикл (~50 мс). Это объясняет psychological refractory period - почему человек не может полностью распараллелить две задачи. Периферийные модули (зрение, слух, руки) работают параллельно, но центральный процессор - строго последовательный.
Формула активации памяти
Ключевая идея ACT-R: каждый chunk (единица знания) имеет **активацию A = B + S + e**, где B - базовый уровень (частота использования), S - spreading activation от контекста, e - шум. Время извлечения: **T = F * exp(-A)**. Чем выше активация, тем быстрее извлечение.
| Феномен | ACT-R предсказание | Верификация |
|---|---|---|
| Spacing effect | Распределённые повторения повышают B сильнее | Подтверждено fMRI 2004 |
| Testing effect | Retrieval укрепляет chunk сильнее чем re-study | Сотни экспериментов |
| Dual-task interference | Один bottleneck = последовательная обработка | PRP experiments |
| Skill acquisition | 3 стадии: cognitive → associative → autonomous | Fitts 1954 + ACT-R |
Что предсказывает формула base-level activation B = ln(sum t^{-d}) в ACT-R?
LIDA: сознание через конкуренцию коалиций
**LIDA (Learning Intelligent Distribution Agent) - единственная когнитивная архитектура, которая явно реализует Global Workspace Theory.** Стэн Франклин создал её в 2005 году как инженерное воплощение теории Баарса: сознание - это победитель конкуренции за глобальное рабочее пространство. Каждый cognitive cycle (~200-500 мс) - борьба коалиций за право быть транслированным всем модулям системы.
**Codelets** - это маленькие специализированные процессы внутри LIDA. Attention codelets ищут важное, behavior codelets предлагают действия, structure building codelets строят понимание из сенсорных данных. Это реализация идеи 'общества разума' Марвина Минского - интеллект как взаимодействие простых агентов.
LIDA реализует сознание, значит она умнее SOAR и ACT-R
LIDA моделирует аспект сознания (broadcast), но не решает более широкий спектр задач
SOAR силён в стратегическом планировании, ACT-R предсказывает human performance, LIDA моделирует внимание и сознание. Это разные инструменты для разных задач, не иерархия.
Почему в LIDA каждый conscious broadcast записывается в episodic memory?
Сравнение и применение к LLM-агентам
**Все три архитектуры решают одну проблему разными способами: как организовать интеллект, который не просто реагирует, но планирует, учится и помнит.** Современные LLM-агенты переизобретают те же компоненты - часто хуже, потому что без 40 лет когнитивной науки за спиной.
| Аспект | SOAR | ACT-R | LIDA |
|---|---|---|---|
| Фокус | Problem solving | Human cognition | Consciousness |
| Обучение | Chunking из impasse | Power law (математика) | Через broadcast |
| Время цикла | Не фиксировано | ~50 мс (bottleneck) | ~200-500 мс |
| Параллелизм | Elaboration (все правила) | Модули параллельны | Codelets параллельны |
| Сила | Стратегическое мышление | Предсказание поведения | Внимание и сознание |
Как эти идеи живут в LLM-агентах
| Компонент архитектуры | SOAR/ACT-R/LIDA | LLM-агент |
|---|---|---|
| Working Memory | Explicit буфер (1 chunk) | Context window (тысячи токенов) |
| Long-Term Memory | Раздельные хранилища | Параметры + RAG + tools |
| Procedural Knowledge | Production rules | In-context паттерны |
| Chunking/Learning | Онлайн, в процессе | Offline training + few-shot |
| Goal Stack | Явный, иерархический | Неявный в prompt |
При проектировании LLM-агента стоит явно реализовать: Working Memory (что в фокусе сейчас), Goal Stack (иерархия целей), Episodic Memory (что происходило), Meta-Cognition (мониторинг уверенности). Системы, которые добавляют эти компоненты явно, стабильнее тех, где всё неявно в параметрах.
Какой из компонентов когнитивных архитектур наиболее отличается от аналога в LLM-агентах?
Вопросы для размышления
- При проектировании LLM-агента для реальной задачи - какие компоненты из SOAR/ACT-R/LIDA стоит добавить явно, и почему нельзя надеяться что они 'emergent' из параметров?