Автоматы и сознание

Когнитивные архитектуры

Цели урока

Понять принципы SOAR: problem space, impasse, chunking как онлайн-обучение
Освоить математические основы ACT-R: активация, retrieval time, power law of forgetting
Разобрать LIDA: conscious broadcast как механизм внимания
Сравнить архитектуры и увидеть их идеи в современных LLM-агентах

Предварительные знания

Global Workspace Theory (урок 11)
Базовое понимание продукционных систем IF-THEN
Знакомство с нейронными сетями на уровне интуиции

SOAR управлял истребителем в 1995. ACT-R предсказывает fMRI паттерны. LIDA реализует GWT инженерно. Всё это - до LLM. Современные агенты переизобретают эти идеи с нуля.

TacAir-Soar (1995): SOAR управлял виртуальным F-16 в симуляторах ВВС США
ACT-R (2004): модель воспроизвела паттерны fMRI при математических задачах с точностью до участка мозга
LIDA используется для моделирования внимания и нарушений сознания в нейронауке
ReAct, AutoGPT, LangGraph: неявно переизобретают SOAR (planning) и ACT-R (memory)
Transformer attention - частичная реализация GWT, но без явного winner-take-all

Три пути к общему интеллекту

Аллен Ньюэлл и Джон Лэрд создали SOAR в 1983 как попытку реализовать 'unified theory of cognition' из книги Ньюэлла. Джон Андерсон разработал ACT-R в 1993, делая упор на математическую точность и предсказание поведения. Стэн Франклин создал LIDA в 2005, интегрируя GWT. Все трое работали параллельно - разные взгляды на одну задачу.

SOAR: обучение через тупики

**1995 год. TacAir-Soar управляет виртуальным истребителем F-16 в авиасимуляторе ВВС США. Система летит, уклоняется от ракет, атакует цели - и самообучается в процессе.** Не нейронная сеть, не LLM. Продукционная система с 50 тысячами правил IF-THEN, которая при каждом новом тупике создаёт новое правило через механизм chunking. Это SOAR - State, Operator And Result.

**SOAR** - проблемно-ориентированная архитектура Аллена Ньюэлла и Джона Лэрда (1983). Всё познание - движение по problem space: текущее состояние + оператор = новое состояние. При невозможности выбрать оператор возникает impasse, создаётся подцель, и после разрешения - новое правило (chunk). Chunking = компиляция опыта.

Три типа памяти и основной цикл

Память	Содержимое	Аналог в LLM
Procedural (LTM)	Production rules: IF conditions THEN actions	Веса модели
Semantic (LTM)	Факты о мире	Предобученные знания
Episodic (LTM)	Воспоминания о событиях	История диалога
Working Memory	Текущее состояние (фокус)	Context window

SOAR - устаревший символьный AI, несовместимый с нейросетями

Идеи SOAR (chunking, impasse, memory types) прямо влияют на архитектуру современных LLM-агентов

Working Memory = context window, Procedural = веса, Episodic = история. Chunking аналогичен in-context learning. Разница: SOAR явно моделирует эти компоненты, LLM делает это неявно в параметрах.

В чём разница между Elaboration и Decision фазами SOAR?

ACT-R: математика человеческой памяти

**ACT-R (Adaptive Control of Thought - Rational) делает то, что не умеет ни одна нейросеть: предсказывает время реакции человека с точностью до миллисекунд.** В 2004 году модель ACT-R точно воспроизвела паттерны fMRI при решении математических задач - до конкретных участков мозга. Джон Андерсон создал не просто архитектуру AI, а формальную модель человеческого познания.

**Центральный bottleneck ACT-R**: только ОДИН production rule может выполняться за цикл (~50 мс). Это объясняет psychological refractory period - почему человек не может полностью распараллелить две задачи. Периферийные модули (зрение, слух, руки) работают параллельно, но центральный процессор - строго последовательный.

Формула активации памяти

Ключевая идея ACT-R: каждый chunk (единица знания) имеет **активацию A = B + S + e**, где B - базовый уровень (частота использования), S - spreading activation от контекста, e - шум. Время извлечения: **T = F * exp(-A)**. Чем выше активация, тем быстрее извлечение.

Феномен	ACT-R предсказание	Верификация
Spacing effect	Распределённые повторения повышают B сильнее	Подтверждено fMRI 2004
Testing effect	Retrieval укрепляет chunk сильнее чем re-study	Сотни экспериментов
Dual-task interference	Один bottleneck = последовательная обработка	PRP experiments
Skill acquisition	3 стадии: cognitive → associative → autonomous	Fitts 1954 + ACT-R

Что предсказывает формула base-level activation B = ln(sum t^{-d}) в ACT-R?

LIDA: сознание через конкуренцию коалиций

**LIDA (Learning Intelligent Distribution Agent) - единственная когнитивная архитектура, которая явно реализует Global Workspace Theory.** Стэн Франклин создал её в 2005 году как инженерное воплощение теории Баарса: сознание - это победитель конкуренции за глобальное рабочее пространство. Каждый cognitive cycle (~200-500 мс) - борьба коалиций за право быть транслированным всем модулям системы.

**Codelets** - это маленькие специализированные процессы внутри LIDA. Attention codelets ищут важное, behavior codelets предлагают действия, structure building codelets строят понимание из сенсорных данных. Это реализация идеи 'общества разума' Марвина Минского - интеллект как взаимодействие простых агентов.

LIDA реализует сознание, значит она умнее SOAR и ACT-R

LIDA моделирует аспект сознания (broadcast), но не решает более широкий спектр задач

SOAR силён в стратегическом планировании, ACT-R предсказывает human performance, LIDA моделирует внимание и сознание. Это разные инструменты для разных задач, не иерархия.

Почему в LIDA каждый conscious broadcast записывается в episodic memory?

Сравнение и применение к LLM-агентам

**Все три архитектуры решают одну проблему разными способами: как организовать интеллект, который не просто реагирует, но планирует, учится и помнит.** Современные LLM-агенты переизобретают те же компоненты - часто хуже, потому что без 40 лет когнитивной науки за спиной.

Аспект	SOAR	ACT-R	LIDA
Фокус	Problem solving	Human cognition	Consciousness
Обучение	Chunking из impasse	Power law (математика)	Через broadcast
Время цикла	Не фиксировано	~50 мс (bottleneck)	~200-500 мс
Параллелизм	Elaboration (все правила)	Модули параллельны	Codelets параллельны
Сила	Стратегическое мышление	Предсказание поведения	Внимание и сознание

Как эти идеи живут в LLM-агентах

Компонент архитектуры	SOAR/ACT-R/LIDA	LLM-агент
Working Memory	Explicit буфер (1 chunk)	Context window (тысячи токенов)
Long-Term Memory	Раздельные хранилища	Параметры + RAG + tools
Procedural Knowledge	Production rules	In-context паттерны
Chunking/Learning	Онлайн, в процессе	Offline training + few-shot
Goal Stack	Явный, иерархический	Неявный в prompt

При проектировании LLM-агента стоит явно реализовать: Working Memory (что в фокусе сейчас), Goal Stack (иерархия целей), Episodic Memory (что происходило), Meta-Cognition (мониторинг уверенности). Системы, которые добавляют эти компоненты явно, стабильнее тех, где всё неявно в параметрах.

Какой из компонентов когнитивных архитектур наиболее отличается от аналога в LLM-агентах?

Вопросы для размышления

При проектировании LLM-агента для реальной задачи - какие компоненты из SOAR/ACT-R/LIDA стоит добавить явно, и почему нельзя надеяться что они 'emergent' из параметров?

Связанные уроки

arch-04-cpu