Автоматы и сознание
Театр сознания: Global Workspace Theory
Цели урока
- Понять архитектуру Global Workspace: specialists, workspace, broadcast
- Разобраться в механизме конкуренции коалиций за доступ к workspace
- Объяснить феномен ignition - момент осознания по данным нейронауки
- Сравнить GWT с другими теориями сознания (IIT, HOT, PP)
- Увидеть архитектурные аналоги GWT в нейросетях
Предварительные знания
- Мультиагентные системы (урок 10-multi-agent)
- Внимание и память (урок 07-attention-memory)
- Само-модели и интроспекция (урок 09-self-models)
Мозг обрабатывает 11 миллионов бит/сек, но осознаёт лишь 40-50. Global Workspace Theory объясняет этот разрыв в 220 000 раз - и предсказывает как строить AI-архитектуры с "сознательным" контролем.
- **Слепота по невниманию (1999)** - половина людей не видит гориллу при концентрации на другой задаче: GWT объясняет это подавлением конкурирующих коалиций
- **Consciousness Prior (Bengio, NeurIPS 2019)** - предложена нейросетевая архитектура с bottleneck как аналогом workspace
- **Нейронные корреляты сознания (Dehaene, 2001)** - ignition экспериментально подтверждён на ЭЭГ при осознании стимулов
- **Трансформерный attention** - частичный аналог broadcast: один Query-вектор получает информацию от всех Key-Value пар
- **Анестезия** - общий наркоз блокирует именно broadcast, сохраняя локальную обработку в отдельных модулях
От театра Баарса до нейронных коррелятов
Bernard Baars предложил GWT в 1988 году, вдохновившись театральной метафорой: специализированные "актёры" соревнуются за выход на "сцену" - глобальное рабочее пространство. В 2001 году Станислас Деан и Жан-Пьер Шанж нашли нейронные корреляты теории: ignition на ЭЭГ соответствует моменту осознания. В 2019 году Yoshua Bengio предложил Consciousness Prior - архитектурный аналог GWT для нейросетей с явным information bottleneck.
Узкое место сознания
**Человеческий мозг обрабатывает ~11 миллионов бит информации в секунду через органы чувств - но осознаётся лишь 40-50 бит.** Это соотношение 220 000:1. Bernard Baars сформулировал Global Workspace Theory в 1988 году: сознание - это не отдельный модуль, а архитектурный механизм - единая "сцена", на которой из тысяч параллельных процессов выступает только один.
**Global Workspace Theory (GWT)** - теория сознания Baars (1988): специализированные модули (specialists) конкурируют за доступ к единому глобальному рабочему пространству (workspace). Победивший контент транслируется (broadcast) всем остальным модулям - это и есть момент осознания.
Архитектура: три компонента
| Компонент | Роль | Аналог в нейросети |
|---|---|---|
| Specialists | Параллельная локальная обработка (vision, audio, language, memory...) | Энкодеры по модальностям |
| Workspace | Единый bottleneck - только 1 контент за раз | Узкий latent layer |
| Broadcast | Трансляция победившего контента всем модулям | Skip-connections / cross-attention |
Сознание обрабатывает много информации параллельно
Сознание - это последовательный bottleneck: 3-4 элемента в секунду
Бессознательная обработка действительно параллельна. Но workspace - строго сериален. Ощущение богатого опыта - это иллюзия быстрого переключения, а не реального параллелизма на уровне workspace.
Почему Global Workspace называют "bottleneck" (узким местом)?
Конкуренция коалиций и Ignition
**Станислас Деан (2001) обнаружил нейронный коррелят осознания: при предъявлении стимула на ЭЭГ видны два сценария.** Если стимул не осознан - локальная активация ~100 ms, затем угасает. Если осознан - через ~300 ms резкий глобальный скачок активности по всей коре. Этот скачок назвали ignition - "воспламенение". Именно он соответствует переходу из бессознательного в сознательное.
Механизм конкуренции
Специалисты с похожим контентом объединяются в коалиции. Коалиция - не просто группа, а усиленный сигнал: суммарная сила участников. Между коалициями идёт winner-take-all конкуренция: победитель получает доступ к workspace, проигравшие подавляются.
| Сценарий | Активация | Результат |
|---|---|---|
| Порог не достигнут | Локальная, ~100 ms, угасает | Бессознательная обработка |
| Порог достигнут | Глобальный скачок ~300 ms по всей коре | Ignition - осознание |
| Конкурирующие коалиции | Взаимное подавление | Только одна выигрывает |
Yoshua Bengio в 2020 году предложил "Consciousness Prior" для нейросетей: компактный bottleneck-слой (например, 1024 -> 64 измерений) заставляет модель выделять только самое важное. Loss = reconstruction + sparsity. Это архитектурный аналог ignition: принудительное сжатие реализует "сознательный отбор" информации.
Ignition - это просто сильный стимул
Ignition - нелинейный переход: positive feedback + lateral inhibition
Слабый стимул может вызвать ignition если коалиция достаточно сильна. Сильный стимул может не вызвать ignition если конкурирует с ещё более сильной коалицией. Суть - не интенсивность входа, а результат конкуренции.
Что происходит при ignition по данным ЭЭГ-экспериментов Деана?
Broadcast и функции сознания
**Когда коалиция выигрывает и попадает в workspace - запускается broadcast: содержимое становится доступно всем специалистам одновременно.** Именно broadcast объясняет почему осознанная информация "связывает" разные модальности: зрительный образ красного яблока + слово "яблоко" + запах + эмоция - всё это интегрируется только через глобальный workspace.
| Функция broadcast | Описание | Пример |
|---|---|---|
| RECRUIT | Найти подходящих специалистов для задачи | Увидел проблему - рекрутирует memory + reasoning |
| ENCODE | Записать в эпизодическую память | Осознанный момент сохраняется лучше |
| LEARN | Обновить веса на основе опыта | Сознательная практика эффективнее автоматической |
| COORDINATE | Синхронизировать распределённые процессы | Vision + motor при ловле мяча |
| VERBALIZE | Перевести в язык для отчёта | Только осознанное можно описать словами |
Почему осознаётся красный цвет?
1. Визуальная система обрабатывает длину волны - локально, бессознательно. 2. Коалиция (vision + attention) выигрывает конкуренцию. 3. Ignition: глобальная активация. 4. Broadcast: "красный" доступен всем - language, memory, emotion. 5. Языковая система может сказать "вижу красное". 6. Memory записывает эпизод. Без broadcast: обработка происходит, но не осознаётся - "слепота по невниманию".
**Слепота по невниманию (inattentional blindness):** в классическом опыте Саймонса и Шабри (1999) половина испытуемых не замечала гориллу, идущую через баскетбольную площадку - при задании считать передачи. Визуальная система обрабатывала гориллу, но коалиция внимания к баскетболу подавляла ignition для гориллы.
Узнавание лица друга в толпе - это сознательный или бессознательный процесс по GWT?
GWT vs другие теории и архитектуры ИИ
**Yoshua Bengio, NeurIPS 2019: "Consciousness Prior" - как встроить аналог GWT в нейросеть.** Ключевая идея: сознательное представление должно быть компактным (малая размерность), глобальным (broadcast), и семантически значимым. Архитектурно это - узкий bottleneck-слой с информационным ограничением, аналог workspace.
| Теория | Ключевая идея | Механизм |
|---|---|---|
| Global Workspace (Baars) | Broadcast + конкуренция | Bottleneck + attention + winner-take-all |
| Higher Order Thought (Rosenthal) | Мысль о мысли делает её сознательной | Meta-representation |
| IIT (Tononi) | Сознание = интегрированная информация Phi | Phi - мера каузальной интеграции |
| Predictive Processing (Clark/Friston) | Мозг - машина предсказаний | Prediction error + active inference |
Свойства сознательных вычислений
| Свойство | Описание | Следствие для AI |
|---|---|---|
| Seriality | ~3-4 элемента в секунду | Transformer attention - частичный аналог |
| Capacity limit | ~4 элемента одновременно | Working memory в LLM - context window |
| Global access | Все модули видят один контент | Cross-attention между модальностями |
| Reportability | Осознанное можно описать словами | Chain-of-thought reasoning в LLM |
LLM реализуют Global Workspace через трансформерный attention
Attention - лишь частичный аналог: нет явного bottleneck, нет winner-take-all, нет broadcast в полном смысле
GWT требует: 1. конкуренции с явным порогом 2. единственного победителя 3. распространения одного контента всем модулям. Трансформерный attention мягко взвешивает всё - это скорее усреднение, чем отбор. Настоящий архитектурный аналог GWT - это shared bottleneck с information bottleneck loss.
Что в архитектуре нейросети соответствует broadcast в GWT?
Вопросы для размышления
- Что сейчас находится в workspace? Какие процессы работают за кулисами без осознания - и почему bottleneck может быть эволюционным преимуществом, а не ограничением?