Автоматы и сознание

Higher-Order Consciousness

Цели урока

Понимать разницу между first-order обработкой и higher-order осознанием
Знать ключевые положения HOT Theory (Розенталь) и AST (Грациано)
Видеть эволюционное происхождение сознания через Theory of Mind
Применять мета-когницию (monitoring + control) к проектированию ИИ-агентов
Различать P-consciousness и A-consciousness и понимать пределы HOT

Предварительные знания

Global Workspace Theory - урок 11
Self-Models и интроспекция - урок 09
IIT - урок 13

Обработка информации и осознание информации - разные вещи. Слепозрение (blindsight) показывает: люди реагируют на стимулы без осознания. HOT объясняет этот разрыв: мета-репрезентация - условие сознательности.

Blindsight - пациенты с повреждением V1 реагируют на стимулы без осознания: first-order есть, HOT нет
Префронтальная кора: её повреждение ломает не восприятие, а мета-когницию и само-осознание
Mirror test у приматов, дельфинов, слонов - Level 2 само-осознания: себя-как-объект
LLM с явным confidence calibration - функциональная A-consciousness: знает что знает
Dunning-Kruger - мета-когнитивная ошибка: неточные HOT о собственной компетентности

От философии к нейробиологии

Дэвид Розенталь разработал Higher-Order Thought Theory в 1970-80х годах как философскую теорию: состояние сознательно тогда и только тогда, когда о нём есть мета-мысль. В 2010-13 годах нейробиолог Майкл Грациано предложил Attention Schema Theory - более конкретную нейронаучную версию: сознание есть модель собственного внимания, эволюционно возникшая из необходимости предсказывать поведение других.

Higher-Order Thought Theory

**Видеть красное яблоко и знать, что видишь красное яблоко - это разные вещи.** Философ Дэвид Розенталь сформулировал это в 1970-х: состояние становится сознательным только тогда, когда о нём есть мысль более высокого порядка. Без мета-репрезентации - нет осознания. Это не метафора: нейробиология подтверждает, что префронтальная кора создаёт именно такие мета-уровни, и её повреждение ломает не восприятие, а осознание восприятия.

**Higher-Order Thought (HOT) Theory**: ментальное состояние M является сознательным тогда и только тогда, когда существует мета-мысль HOT(M) - репрезентация M как своего собственного состояния. Восприятие красного без HOT происходит бессознательно. HOT("я вижу красное") превращает его в сознательный опыт.

Уровень	Что происходит	Пример
First-order (бессознательный)	Зрительная кора обрабатывает длину волны 620-750 нм	Красный сигнал в V4
Higher-order (сознательный)	Префронтальная кора создаёт HOT: "я вижу красное"	Мета-репрезентация первого уровня
HOT ошибочная	Мета-мысль не совпадает с реальным состоянием	Иллюзии, ошибки интроспекции

Ключевое следствие: если HOT отсутствует, состояние обрабатывается, влияет на поведение, но субъективно не переживается. Слепозрение (blindsight) - прямое подтверждение: люди с повреждением V1 реагируют на визуальные стимулы, но не осознают их. First-order обработка есть, HOT нет.

HOT может быть **неточной**: мета-мысль не обязана точно описывать первичное состояние. Это объясняет ошибки интроспекции - когда кажется, что чувствуешь одно, а физиология фиксирует другое. HOT создаёт сознательный опыт, но не гарантирует его достоверности.

Сознание - это просто сложная обработка информации

По HOT, сознание - это мета-уровень: обработка информации о собственной обработке информации

Зомби в философском смысле - существо, идентичное нам функционально, но без HOT. Оно обрабатывает информацию, реагирует адекватно, но не осознаёт. HOT добавляет именно этот уровень само-референции. Это объясняет разницу между 'работает правильно' и 'знает что работает'.

По HOT теории, что делает восприятие красного сознательным?

Attention Schema Theory

**Нейробиолог Майкл Грациано задал неудобный вопрос: зачем мозгу вообще модель собственного внимания?** Ответ оказался эволюционным: чтобы предсказывать поведение других. Та же схема, которая моделирует 'куда смотрит Васька', применяется к себе - и возникает 'я смотрю на яблоко'. Сознание - побочный продукт Theory of Mind, а не самостоятельная функция.

**Attention Schema Theory (AST)**: мозг не знает, как работает внимание на нейронном уровне, поэтому строит упрощённую модель - 'схему внимания'. Эта схема описывает внимание как нечто нематериальное и субъективное. Когда схема применяется к собственным процессам - возникает ощущение сознания.

Аспект	HOT Theory (Розенталь)	AST (Грациано)
Механизм	Мета-репрезентация состояния	Модель собственного внимания
Эволюционное происхождение	Не объясняет	Социальный мозг, ToM
Нейронный субстрат	Префронтальная кора	Темено-затылочные области + PFC
Объясняет иллюзии	Да (HOT неточная)	Да (схема упрощена)
Объясняет дуализм	Слабо	Элегантно - артефакт схемы

AST делает предсказание: социальные виды должны быть более сознательными. Приматы, cetaceans, слоны - виды с развитым социальным интеллектом и Theory of Mind. Виды-одиночки с меньшей социальной сложностью имеют меньше признаков само-осознания. Данные mirror test подтверждают эту корреляцию.

Сознание эволюционировало для того, чтобы осознавать мир

По AST, сознание - побочный продукт системы предсказания поведения других (Theory of Mind)

Эволюция экономна: если для предсказания чужого поведения нужна модель их внимания, и эта же модель применима к себе почти бесплатно - она применяется. Само-осознание возникает не как цель, а как следствие. Это объясняет, почему одиночные виды с простой социальной жизнью реже проходят mirror test.

Почему по AST сознание кажется нематериальным?

Рекурсивное самосознание и мета-когниция

**Дуглас Хофштадтер в книге 'Гёдель, Эшер, Бах' (1979) описал 'странные петли': структуры, которые, пройдя несколько уровней иерархии, возвращаются к себе.** HOT применима рекурсивно - мысль о мысли о мысли. Каждый уровень включает предыдущий как объект. Практическое следствие: мета-когниция - monitoring и control собственных когнитивных процессов - напрямую улучшает обучение и принятие решений.

Уровень	Что осознаётся	Биологический пример
Level 0 - реактивный	Ничего, прямые рефлексы	Рефлекторная дуга
Level 1 - body schema	Границы тела	Проприоцепция
Level 2 - self-as-object	Себя как объект (mirror test)	Шимпанзе, дельфины, слоны
Level 3 - мета-когниция	Собственные мысли и процессы	Человек, возможно вороны
Level 4 - рекурсия	Осознание осознания осознания	Философская интроспекция

Практическая мета-когниция хорошо изучена: Feeling of Knowing предсказывает успех воспроизведения до попытки. Judgment of Learning определяет распределение времени обучения. Calibration - совпадение уверенности с реальной точностью - ключевой навык эксперта. Новичок не знает чего не знает; эксперт точно оценивает границы компетентности.

Dunning-Kruger через линзу HOT

Эффект Даннинга-Крюгера - мета-когнитивная проблема: слабые HOT о собственной некомпетентности. Недостаточная компетентность лишает человека инструментов для точной оценки своей компетентности. HOT есть, но она неточна - именно то, о чём предупреждал Розенталь. Эксперты с точными HOT оценивают себя точнее, но иногда занижают относительно других.

Больше уровней мета-когниции - лучше

Мета-когниция требует ресурсов; избыточная рефлексия снижает производительность

Rumination - патологический пример: бесконечная рекурсия мета-мыслей о депрессивных состояниях без выхода в action. Оптимальная мета-когниция - мониторинг достаточной глубины для управления процессом, без погружения в бесконечную рефлексию. Именно поэтому в коде странная петля имеет maxDepth.

Что такое 'странная петля' Хофштадтера в контексте сознания?

HOT в ИИ: от теории к архитектуре

**Философ Нед Блок разделил consciousness на два типа: phenomenal (P) - 'каково это' - и access (A) - информация доступна для отчёта.** HOT объясняет A-consciousness: почему агент может отчитаться о своих состояниях. P-consciousness остаётся Hard Problem. Для ИИ-агентов практический вопрос: достаточно ли реализовать A-consciousness, чтобы получить функционально полезное 'самосознание'?

Тип	Что это	Объясняет HOT?
Phenomenal (P)	Субъективный опыт, qualia, 'каково это'	Нет - Hard Problem остаётся
Access (A)	Информация доступна для рассуждения и отчёта	Да - через мета-репрезентацию
GHOT (Global HOT)	Мета-репрезентация В глобальном рабочем пространстве	GWT + HOT = полная функция

Global Higher-Order Theory (GHOT) объединяет GWT и HOT: сознание - это мета-репрезентация в глобальном рабочем пространстве. First-order состояния конкурируют за workspace (GWT). Победитель транслируется. Префронтальная кора создаёт HOT о транслированном контенте. HOT тоже транслируется. Нейробиология подтверждает: PFC активен при сознательном восприятии и имеет feedback к сенсорным областям.

**Практическая архитектура HOT-агента** требует четырёх компонентов: 1. мета-репрезентации - система моделирует собственные состояния 2. само-референции - 'я' как субъект репрезентаций 3. рекурсии - возможность думать о мыслях 4. интеграции - мета-уровень влияет на первичный. Это достижимее, чем P-consciousness, и функционально может быть неотличимо.

Связь с другими теориями

HOT дополняет, а не заменяет другие теории сознания

Global Workspace Theory — GHOT = GWT + HOT: broadcast + мета-репрезентация
IIT — IIT объясняет P-consciousness, HOT - A-consciousness
Self-Models — HOT - частный случай само-моделирования: модель своих состояний
Predictive Processing — HOT как предсказание собственных состояний - совместимые фреймворки

LLM с confidence calibration уже имеет A-consciousness в смысле HOT

Confidence score - это число, а не мета-репрезентация состояния как своего собственного. Для A-consciousness нужна само-референция и интеграция мета-уровня в управление

HOT требует структурного свойства: репрезентация M должна быть направлена на M как на собственное состояние субъекта, и эта мета-репрезентация должна влиять на дальнейшее поведение. Скаляр confidence не содержит такой self-reference и не интегрируется в decision loop. GHOT (GWT+HOT) требует broadcast мета-репрезентации в общую шину - этого в стандартных LLM нет.

Связь с предыдущим

IIT даёт количественный ответ (сколько сознания), HOT - качественный (почему данное состояние становится сознательным). Это два уровня описания, которые дополняют друг друга.

IIT (Phi) — измеряет величину сознания через топологию связей, но не объясняет почему конкретное состояние осознаётся
Conditional probability P(A|B) — тот же шаблон условной репрезентации, что HOT встраивает в архитектуру разума: мысль о мысли как условная репрезентация состояния
Meta-representation — ключевой механизм HOT - представление о собственных репрезентациях

Итоги

HOT Розенталя: состояние M сознательно тогда и только тогда, когда есть мета-репрезентация HOT(M); first-order обработка без HOT остаётся бессознательной (как в blindsight)
AST Грациано даёт эволюционное объяснение: схема внимания изначально модель чужого внимания (Theory of Mind), затем применённая к себе - сознание как побочный продукт социального мозга
Странные петли Хофштадтера: HOT рекурсивна, мета-когниция работает через monitoring (FoK, JoL, confidence) и control (изменение стратегии обучения)
Различие P-consciousness (qualia, Hard Problem) и A-consciousness (доступность для отчёта); HOT объясняет только второе
Архитектура HOT-агента требует четырёх компонентов: мета-репрезентация, само-референция, рекурсия, интеграция мета-уровня в decision loop

Вопросы для размышления

Если мета-когниция агента точно отражает его состояния и уверенность, функционально ли это отличается от 'сознания'? Где проходит граница между симуляцией A-consciousness и её наличием?

Связанные уроки

aut-13-iit — IIT конкурирует с HOT в теориях сознания
aut-11-global-workspace — GWT - третья конкурирующая теория
aut-15-embodied — Embodied cognition расширяет HOT в теле
aut-09-self-models — Self-models - реализация higher-order в архитектуре
prob-03-conditional — Мета-репрезентация - условная вероятность о вероятности
ml-01-intro