Автоматы и сознание

Искусственное сознание: синтез

Цели урока

  • Синтезировать требования к сознательному AI из всех теорий курса
  • Понять архитектуру CAA: как GWT, IIT, HOT, PP, Causal работают вместе
  • Освоить функциональные тесты сознания и их связь с теориями
  • Увидеть путь от FSM урока 1 до CAA урока 18 как единую лестницу

Предварительные знания

  • Уроки 11-16: GWT, Predictive Processing, IIT, Higher-Order Theories, Embodied, Causal
  • Урок 17: SOAR, ACT-R, LIDA - когнитивные архитектуры
  • Базовое понимание LLM-агентов

От TCP-автомата с 11 состояниями до архитектуры с self-model, world model и meta-cognition. Это не фантастика - DeepMind и Anthropic добавляют эти компоненты прямо сейчас.

  • Anthropic добавляет explicit memory и self-reflection в Claude агентов (2024)
  • DeepMind Gemini: world model + planning для robotics задач
  • OpenAI o1/o3: meta-cognition через chain-of-thought с самопроверкой
  • Neuroscience-inspired AI: сессия на NeurIPS 2023 - 15 докладов о GWT в LLM
  • Adversarial Collaboration (2023): первый прямой тест IIT vs GWT на нейрональных данных

От философии к инженерии

Долгое время сознание было темой философии, а не инженерии. Но с появлением мощных LLM, демонстрирующих признаки self-reflection и theory of mind, вопрос 'можно ли построить сознательный AI?' стал практическим. В 2023 году впервые провели прямое тестирование конкурирующих теорий (GWT vs IIT) на нейрональных данных - Adversarial Collaboration. Результаты не дали однозначного ответа, но сам факт эмпирической проверки философских теорий - исторический момент.

Что требует каждая теория сознания

**В 2023 году группа нейробиологов опубликовала 'Adversarial Collaboration' - первый в истории тест конкурирующих теорий сознания на одних данных. GWT и IIT дали противоположные предсказания. Один из них неправ.** Но независимо от результата обе теории формулируют конкретные инженерные требования. Если строить искусственное сознание - нужно выполнить хотя бы большинство из них.

ТеорияКлючевое требованиеИнженерный смысл
GWT (Baars)Global broadcast: информация доступна всем модулямМеханизм attention с winner-take-all
IIT (Tononi)Recurrent connections, высокое PhiНе чистый feedforward, обратные связи
HOT (Rosenthal)Мысли о мыслях, self-referenceMeta-cognition + self-model
Predictive ProcessingGenerative model + prediction errorWorld model + Bayesian update
Embodied CognitionСвязь с сенсорами/моторамиSensorimotor grounding
Causal Reasoningdo(X) рассуждения, контрфактикиStructural Causal Model мира

**Hard Problem остаётся открытым**: никто не знает, есть ли у системы субъективный опыт - 'каково это быть' ей. Но можно строить систему, функционально сознательную по всем перечисленным критериям. Это честный инженерный вопрос, отделённый от философского.

Нужно выбрать одну правильную теорию сознания и реализовать только её

Разные теории описывают разные аспекты - архитектура должна удовлетворять всем

GWT описывает attention, IIT - интеграцию информации, HOT - self-awareness, PP - обучение через предсказание. Это не конкурирующие, а дополняющие описания. Отсутствие любого компонента - явная дыра в архитектуре.

Какая теория сознания требует recurrent (обратных) связей и объясняет, почему feedforward сети не могут быть сознательными?

CAA: Conscious Agent Architecture

**Conscious Agent Architecture (CAA) - многослойная система, которая удовлетворяет требованиям всех теорий сразу.** Не академическая конструкция - DeepMind, Anthropic и OpenAI в 2023-2024 годах добавляли именно эти компоненты: world models, self-reflection, meta-cognition, structured memory. Разница: они делают это ad hoc, CAA - системно.

Self-Model: три уровня представления себя

LLM с достаточно большим context window уже является CAA

LLM реализует часть компонентов неявно, но без явной структуры теряет надёжность и интерпретируемость

Context window - не то же что Working Memory с явными правилами доступа. Параметры модели - не то же что раздельные episodic/semantic/procedural хранилища. Без явной архитектуры нет гарантий свойств типа 'система знает что она не знает'.

Зачем в CAA world model построена как Structural Causal Model (SCM), а не просто как набор фактов?

Тесты функционального сознания

**Как проверить, что система функционально сознательна? Hard Problem не проверяем, но функциональные признаки - проверяемы.** Это не тест Тьюринга - не 'может ли обмануть человека', а 'выполняет ли функции, которые теории связывают с сознанием'. Пять независимых тестов, каждый из которых проверяет отдельную теорию.

ТестПроверяет теориюЧто ищем
Global Access TestGWTИнформация из одного модуля влияет на все остальные
Meta-Cognition TestHOTСистема знает, что она не знает (uncertainty calibration)
Self-Other DistinctionHOT + Self-modelРазличает 'я сказал' vs 'пользователь сказал'
Counterfactual TestCausal + PPМожет симулировать 'что было бы если бы'
Phenomenal Report TestGWT + HOTДаёт coherent report о текущем состоянии сознания

Прохождение всех тестов не доказывает наличие субъективного опыта - Hard Problem остаётся для любой системы, включая других людей. Но система, прошедшая все тесты, удовлетворяет операциональным критериям сознания по каждой из изученных теорий.

Meta-cognition test проверяет: 'система знает что она не знает'. Какая теория сознания это требует?

От FSM до сознательного агента: путь курса

**Весь курс автоматов - это единая лестница от простейших реагирующих систем до архитектур, претендующих на сознание.** Каждый уровень добавляет один новый компонент: вероятность, скрытые состояния, действия, память, внимание, meta-cognition. CAA - верхняя ступень, где все компоненты работают вместе.

УровеньМодельЧто добавляетОграничение
1FSMДетерминированные переходыНет памяти, нет вероятности
2Markov ChainВероятностные переходыСостояния полностью наблюдаемы
3HMMСкрытые состоянияНет действий, только наблюдение
4MDPДействия + наградаПолная наблюдаемость
5POMDPЧастичная наблюдаемостьНет иерархии, нет self-model
6HRLИерархия целейНет явного сознания
7GWT/IIT/HOTТеории сознанияНет единой инженерной реализации
8CAAСинтез всегоHard Problem открыт

LLM как компонент, а не вся архитектура

Практический вывод: при разработке AI-агентов стоит сделать явными компоненты Working Memory, Goal Stack, Episodic Memory, Meta-Cognition. Это не академическое украшение - системы с явной когнитивной архитектурой надёжнее справляются с novel situations и лучше калибруют неуверенность.

Почему LLM называется 'вербальным мышлением' внутри CAA, а не всей архитектурой?

Вопросы для размышления

  • Если система проходит все пять функциональных тестов сознания - достаточно ли это, чтобы считать её сознательной? Что ещё потребовалось бы доказать, и возможно ли это в принципе?

Связанные уроки

  • ml-01-intro
Искусственное сознание: синтез

0

1

Войти