Автоматы и сознание

Когнитивные архитектуры

Цели урока

  • Понять принципы SOAR: problem space, impasse, chunking как онлайн-обучение
  • Освоить математические основы ACT-R: активация, retrieval time, power law of forgetting
  • Разобрать LIDA: conscious broadcast как механизм внимания
  • Сравнить архитектуры и увидеть их идеи в современных LLM-агентах

Предварительные знания

  • Global Workspace Theory (урок 11)
  • Базовое понимание продукционных систем IF-THEN
  • Знакомство с нейронными сетями на уровне интуиции

SOAR управлял истребителем в 1995. ACT-R предсказывает fMRI паттерны. LIDA реализует GWT инженерно. Всё это - до LLM. Современные агенты переизобретают эти идеи с нуля.

  • TacAir-Soar (1995): SOAR управлял виртуальным F-16 в симуляторах ВВС США
  • ACT-R (2004): модель воспроизвела паттерны fMRI при математических задачах с точностью до участка мозга
  • LIDA используется для моделирования внимания и нарушений сознания в нейронауке
  • ReAct, AutoGPT, LangGraph: неявно переизобретают SOAR (planning) и ACT-R (memory)
  • Transformer attention - частичная реализация GWT, но без явного winner-take-all

Три пути к общему интеллекту

Аллен Ньюэлл и Джон Лэрд создали SOAR в 1983 как попытку реализовать 'unified theory of cognition' из книги Ньюэлла. Джон Андерсон разработал ACT-R в 1993, делая упор на математическую точность и предсказание поведения. Стэн Франклин создал LIDA в 2005, интегрируя GWT. Все трое работали параллельно - разные взгляды на одну задачу.

SOAR: обучение через тупики

**1995 год. TacAir-Soar управляет виртуальным истребителем F-16 в авиасимуляторе ВВС США. Система летит, уклоняется от ракет, атакует цели - и самообучается в процессе.** Не нейронная сеть, не LLM. Продукционная система с 50 тысячами правил IF-THEN, которая при каждом новом тупике создаёт новое правило через механизм chunking. Это SOAR - State, Operator And Result.

**SOAR** - проблемно-ориентированная архитектура Аллена Ньюэлла и Джона Лэрда (1983). Всё познание - движение по problem space: текущее состояние + оператор = новое состояние. При невозможности выбрать оператор возникает impasse, создаётся подцель, и после разрешения - новое правило (chunk). Chunking = компиляция опыта.

Три типа памяти и основной цикл

ПамятьСодержимоеАналог в LLM
Procedural (LTM)Production rules: IF conditions THEN actionsВеса модели
Semantic (LTM)Факты о миреПредобученные знания
Episodic (LTM)Воспоминания о событияхИстория диалога
Working MemoryТекущее состояние (фокус)Context window

SOAR - устаревший символьный AI, несовместимый с нейросетями

Идеи SOAR (chunking, impasse, memory types) прямо влияют на архитектуру современных LLM-агентов

Working Memory = context window, Procedural = веса, Episodic = история. Chunking аналогичен in-context learning. Разница: SOAR явно моделирует эти компоненты, LLM делает это неявно в параметрах.

В чём разница между Elaboration и Decision фазами SOAR?

ACT-R: математика человеческой памяти

**ACT-R (Adaptive Control of Thought - Rational) делает то, что не умеет ни одна нейросеть: предсказывает время реакции человека с точностью до миллисекунд.** В 2004 году модель ACT-R точно воспроизвела паттерны fMRI при решении математических задач - до конкретных участков мозга. Джон Андерсон создал не просто архитектуру AI, а формальную модель человеческого познания.

**Центральный bottleneck ACT-R**: только ОДИН production rule может выполняться за цикл (~50 мс). Это объясняет psychological refractory period - почему человек не может полностью распараллелить две задачи. Периферийные модули (зрение, слух, руки) работают параллельно, но центральный процессор - строго последовательный.

Формула активации памяти

Ключевая идея ACT-R: каждый chunk (единица знания) имеет **активацию A = B + S + e**, где B - базовый уровень (частота использования), S - spreading activation от контекста, e - шум. Время извлечения: **T = F * exp(-A)**. Чем выше активация, тем быстрее извлечение.

ФеноменACT-R предсказаниеВерификация
Spacing effectРаспределённые повторения повышают B сильнееПодтверждено fMRI 2004
Testing effectRetrieval укрепляет chunk сильнее чем re-studyСотни экспериментов
Dual-task interferenceОдин bottleneck = последовательная обработкаPRP experiments
Skill acquisition3 стадии: cognitive → associative → autonomousFitts 1954 + ACT-R

Что предсказывает формула base-level activation B = ln(sum t^{-d}) в ACT-R?

LIDA: сознание через конкуренцию коалиций

**LIDA (Learning Intelligent Distribution Agent) - единственная когнитивная архитектура, которая явно реализует Global Workspace Theory.** Стэн Франклин создал её в 2005 году как инженерное воплощение теории Баарса: сознание - это победитель конкуренции за глобальное рабочее пространство. Каждый cognitive cycle (~200-500 мс) - борьба коалиций за право быть транслированным всем модулям системы.

**Codelets** - это маленькие специализированные процессы внутри LIDA. Attention codelets ищут важное, behavior codelets предлагают действия, structure building codelets строят понимание из сенсорных данных. Это реализация идеи 'общества разума' Марвина Минского - интеллект как взаимодействие простых агентов.

LIDA реализует сознание, значит она умнее SOAR и ACT-R

LIDA моделирует аспект сознания (broadcast), но не решает более широкий спектр задач

SOAR силён в стратегическом планировании, ACT-R предсказывает human performance, LIDA моделирует внимание и сознание. Это разные инструменты для разных задач, не иерархия.

Почему в LIDA каждый conscious broadcast записывается в episodic memory?

Сравнение и применение к LLM-агентам

**Все три архитектуры решают одну проблему разными способами: как организовать интеллект, который не просто реагирует, но планирует, учится и помнит.** Современные LLM-агенты переизобретают те же компоненты - часто хуже, потому что без 40 лет когнитивной науки за спиной.

АспектSOARACT-RLIDA
ФокусProblem solvingHuman cognitionConsciousness
ОбучениеChunking из impassePower law (математика)Через broadcast
Время циклаНе фиксировано~50 мс (bottleneck)~200-500 мс
ПараллелизмElaboration (все правила)Модули параллельныCodelets параллельны
СилаСтратегическое мышлениеПредсказание поведенияВнимание и сознание

Как эти идеи живут в LLM-агентах

Компонент архитектурыSOAR/ACT-R/LIDALLM-агент
Working MemoryExplicit буфер (1 chunk)Context window (тысячи токенов)
Long-Term MemoryРаздельные хранилищаПараметры + RAG + tools
Procedural KnowledgeProduction rulesIn-context паттерны
Chunking/LearningОнлайн, в процессеOffline training + few-shot
Goal StackЯвный, иерархическийНеявный в prompt

При проектировании LLM-агента стоит явно реализовать: Working Memory (что в фокусе сейчас), Goal Stack (иерархия целей), Episodic Memory (что происходило), Meta-Cognition (мониторинг уверенности). Системы, которые добавляют эти компоненты явно, стабильнее тех, где всё неявно в параметрах.

Какой из компонентов когнитивных архитектур наиболее отличается от аналога в LLM-агентах?

Вопросы для размышления

  • При проектировании LLM-агента для реальной задачи - какие компоненты из SOAR/ACT-R/LIDA стоит добавить явно, и почему нельзя надеяться что они 'emergent' из параметров?

Связанные уроки

  • arch-04-cpu
Когнитивные архитектуры

0

1

Войти