AR/VR
Введение в XR: AR, VR, MR
Apple Vision Pro: 23 миллиона пикселей - больше, чем один 4K-экран на каждый глаз. 12 камер, 5 сенсоров, два чипа M2 и R1 специально для обработки видеопотока. Почему R1 обрабатывает кадры за 12 мс? Потому что motion-to-photon latency выше 20 мс вызывает VR sickness у 40% пользователей. Meta Quest 2 разошёлся тиражом 20+ миллионов единиц. Хирурги в Cedars-Sinai уже выполняют операции с AR-оверлеем МРТ прямо поверх тела пациента. XR - это не будущее. Это инфраструктура, которая строится прямо сейчас.
- **Медицина:** хирурги в Cedars-Sinai (Лос-Анджелес) используют AR-навигацию во время операций на позвоночнике - точность позиционирования инструмента улучшается на 40% по сравнению с традиционной флюороскопией
- **Обучение:** армия США использует HoloLens 2 для тактических тренировок, Boeing - для сборки проводки самолётов (время сборки -25%, ошибки -40%)
- **VR-терапия:** протокол Bravemind (USC Institute) лечит ПТСР у ветеранов через экспозиционную терапию в VR - одобрен FDA для клинического применения
- **Потребительский рынок:** Meta Quest 2 - 20M+ продаж, Beat Saber - первая VR-игра с оборотом свыше 100 миллионов долларов, рынок XR к 2030 году - 1.7 триллиона долларов по прогнозу Goldman Sachs
Augmented Reality: цифровой слой поверх реальности
Июль 2016 года. Нью-Йоркский Центральный парк в 2 часа ночи - сотни людей с фонарями на смартфонах охотятся за редким покемоном. **Pokemon Go** скачали 500 миллионов раз за два месяца. Это стало первым массовым знакомством человечества с Augmented Reality - технологией наложения цифровых объектов на реальный мир.
**Augmented Reality (AR)** добавляет виртуальные элементы (изображения, 3D-модели, текст, звук) в восприятие реального мира. Ключевое слово - «дополняет». Реальность остаётся базовой - цифровые объекты появляются поверх неё, не заменяя её.
**Три обязательных свойства AR** (по определению Рональда Азумы, 1997): 1) Совмещение реального и виртуального. 2) Взаимодействие в реальном времени. 3) Привязка к 3D-пространству (виртуальные объекты «знают» своё место в мире).
| Приложение | Что делает AR | Сфера |
|---|---|---|
| Pokemon Go | Размещает покемонов на тротуаре, в парке | Развлечения |
| IKEA Place | Показывает мебель в вашей комнате в реальном масштабе | Ритейл |
| Google Translate | Переводит надписи прямо через камеру | Утилиты |
| AccuVein | Проецирует карту вен на кожу пациента | Медицина |
| Snapchat Filters | Накладывает маски и эффекты на лицо | Соцсети |
Первый AR-дисплей
В 1968 году Айвен Сазерленд создал «Дамоклов меч» (The Sword of Damocles) - первый head-mounted display, который отображал простую wireframe-графику поверх реального мира. Устройство было настолько тяжёлым, что крепилось к потолку.
Современный AR работает на двух типах устройств: **смартфоны/планшеты** (video see-through AR - камера снимает мир, результат с наложением отображается на экране) и **AR-очки** (optical see-through AR - цифровое изображение проецируется на прозрачные линзы). Смартфонный AR доступен 3+ миллиардам людей уже сейчас. Очки дают более естественный опыт - руки свободны, нет экрана между глазами и миром.
Какое из свойств НЕ является обязательным для AR по определению Азумы?
Virtual Reality: полное погружение
AR добавляет цифровое **поверх** реального. **Virtual Reality (VR)** делает радикальный шаг - полностью заменяет реальность на цифровую. Apple Vision Pro: 23 миллиона пикселей, обработка за 12 мс. Надев шлем, перестаёшь видеть комнату. Оказываешься на краю вулкана, в открытом космосе или внутри молекулы ДНК.
**Главная цель VR - presence** (ощущение присутствия). Момент, когда мозг «забывает» о шлеме и реагирует на виртуальный мир как на настоящий. Люди инстинктивно уклоняются от летящих в них виртуальных объектов и боятся виртуальной высоты - это не баг, это маркер того, что presence достигнут.
Два приёма создают иллюзию погружения. **Стереоскопия**: два экрана с чуть разными изображениями имитируют бинокулярное зрение мозга. **Head tracking**: поворот головы - виртуальный мир поворачивается синхронно. Именно поэтому latency обработки кадра критична: Vision Pro держит 12 мс, Meta Quest 3 - ~13 мс. Выше 20 мс - motion sickness у 40% пользователей.
| Устройство | DoF | Тип | Примечание |
|---|---|---|---|
| Google Cardboard | 3DoF | Мобильный VR | Смартфон в картонном держателе |
| Meta Quest 3 | 6DoF | Standalone | Автономный шлем, не нужен ПК |
| HTC Vive Pro 2 | 6DoF | PC VR | Подключается к мощному компьютеру |
| PlayStation VR2 | 6DoF | Консольный VR | Подключается к PlayStation 5 |
| Valve Index | 6DoF | PC VR | Высокая частота обновления (144 Hz) |
**Разница между 3DoF и 6DoF принципиальна.** 3DoF: только вращение головы - как сидеть в кресле и смотреть вокруг. 6DoF: ещё и перемещение - подойти к виртуальному столу, наклониться, присесть. Именно 6DoF превращает VR из «панорамного просмотра» в полноценную среду, где можно существовать. Google Cardboard дал 3DoF за 15 долларов. Meta Quest 3 даёт 6DoF автономно без PC.
**Motion sickness (укачивание) в VR** - серьёзная проблема. Возникает, когда глаза видят движение, а вестибулярный аппарат его не ощущает. До 40% пользователей испытывают дискомфорт в первых VR-сессиях. Поэтому стабильные 90 FPS - абсолютный минимум для комфортного VR.
Чем 6DoF принципиально отличается от 3DoF?
Mixed Reality: слияние миров
AR добавляет цифровое поверх реального. VR заменяет реальное цифровым. **Mixed Reality (MR)** - третий путь: виртуальные объекты **взаимодействуют** с реальными. Виртуальный мяч отскакивает от настоящего стола. Цифровой персонаж прячется за настоящим диваном. Хирург видит МРТ-снимок, наложенный на тело пациента с точностью до миллиметра.
**Ключевое отличие MR от AR**: в AR цифровые объекты «парят» поверх реальности. В MR они **понимают** физический мир - знают, где стены, пол, мебель - и реагируют на них физически. MR-объект лежит на столе и остаётся там, даже если обойти стол - потому что устройство отслеживает геометрию комнаты в реальном времени.
Для работы MR устройство строит **spatial map** (пространственную карту) окружения. Камеры и depth-сенсоры сканируют комнату, создавая 3D-mesh поверхностей. HoloLens 2 делает это через time-of-flight камеры, Apple Vision Pro - через LiDAR и структурированный свет. Именно эта карта позволяет виртуальному объекту «лечь» на конкретный реальный стол.
| Устройство | Технология | Применение |
|---|---|---|
| Microsoft HoloLens 2 | Прозрачные линзы + depth-камеры | Промышленность, медицина, обучение |
| Magic Leap 2 | Waveguide-дисплей + LiDAR | Enterprise-решения, 3D-визуализация |
| Meta Quest 3 | Passthrough + depth-сенсор | Потребительский MR, игры |
| Apple Vision Pro | Passthrough + LiDAR + камеры | Пространственные вычисления (spatial computing) |
**Spatial anchors** - фундамент MR. Виртуальная «ваза» поставлена на стол, шлем снят, через час надет снова - ваза стоит на том же месте. Устройство распознаёт окружение через feature points и восстанавливает привязки. Именно поэтому хирургический AR-дисплей не смещается при движении головы врача - якорь привязан к маркеру на теле пациента.
Происхождение термина Mixed Reality
Термин «Mixed Reality» впервые появился в статье Пола Милгрэма и Фумио Кисино «A Taxonomy of Mixed Reality Visual Displays» (1994). Они предложили модель Reality-Virtuality Continuum - непрерывного спектра от полностью реального до полностью виртуального, где MR охватывает всё пространство между крайними точками.
Что позволяют spatial anchors в Mixed Reality?
XR-спектр: Reality-Virtuality Continuum
Pokemon Go - AR. Apple Vision Pro - одновременно AR, VR и MR в зависимости от режима. VR-тренажёр пилота - чистый VR. Хирургический дисплей AccuVein - ближе к MR. Все эти технологии кажутся разными, но это точки на одном спектре. В 1994 году Пол Милгрэм формализовал это в единый фреймворк: **Reality-Virtuality Continuum**.
**XR (Extended Reality)** - зонтичный термин для всего спектра. AR, VR, MR - подмножества XR. Именно поэтому Apple называет Vision Pro «устройством пространственных вычислений» (spatial computing) - это честнее, чем AR или VR, потому что устройство существует в разных точках спектра одновременно.
**Augmented Virtuality (AV)** - менее известная, но важная точка спектра. Это виртуальный мир, в который добавлены элементы реального. Пример: вы в VR-игре, но видите контуры своих настоящих рук или реальную мебель, чтобы не споткнуться. Passthrough-режим Quest 3 и Vision Pro работает именно так.
| Технология | Базовый мир | Что добавлено | Пример |
|---|---|---|---|
| AR | Реальный | Цифровые объекты | Pokemon Go, Snapchat-фильтры |
| AV | Виртуальный | Элементы реальности | Passthrough в VR-шлемах |
| MR | Смешанный | Взаимодействие обоих | HoloLens, Vision Pro |
| VR | Виртуальный | Ничего реального | Beat Saber, Half-Life: Alyx |
Границы между точками спектра **размываются**. Один и тот же Vision Pro - AR (прозрачные окна в реальном мире), VR (полное погружение), MR (виртуальный объект лежит на конкретном столе). Устройство переключается между режимами. Вот почему жёсткая классификация устарела - важнее понять, какую точку спектра решение занимает в конкретный момент.
Pokemon Go из начала урока - чистый AR: реальный мир остаётся базовым, покемоны добавляются поверх. AccuVein ближе к MR: проекция вен должна точно соответствовать анатомии пациента, а значит нужен spatial mapping и якорение к телу. Весь XR-спектр - единая шкала «сколько реальности vs. виртуальности». Технология выбирается под задачу.
VR - это только для игр и развлечений
VR активно используется в медицине, промышленности, армии и психотерапии - зачастую с измеримым превосходством над традиционными методами
Игры были первым массовым применением, отсюда стереотип. Но Boeing использует HoloLens для сборки самолётов (-25% времени, -40% ошибок). Армия США тренирует тактику в VR. FDA одобрила VR-протокол лечения ПТСР. Рынок медицинского XR к 2027 году - 9.7 миллиарда долларов. Presence делает VR мощным везде, где важно «побывать» без реального риска
Ключевые идеи
- **AR** дополняет реальный мир цифровым (Pokemon Go, AccuVein, IKEA Place) - реальность остаётся базовой, три обязательных свойства по Азуме 1997
- **VR** заменяет реальность цифровой полностью - presence как цель, latency < 20 мс как инженерное требование, 6DoF как условие глубокого погружения
- **MR** = spatial mapping + spatial anchors: виртуальные объекты понимают геометрию комнаты и физически взаимодействуют с реальными поверхностями
- **Reality-Virtuality Continuum** (Милгрэм, 1994) - единый спектр от полностью реального до полностью виртуального; XR - зонтичный термин для всего спектра
- **Технология выбирается под задачу**: обучение в опасных условиях - VR, навигация при операции - MR/AR, примерка мебели - смартфонный AR
Связанные темы
XR-технологии опираются на фундамент из оптики, трекинга и компьютерного зрения:
- Оптика и дисплеи — Как линзы, FoV и разрешение создают визуальную иллюзию в XR-устройствах
- Трекинг: 6DoF — Как устройство определяет положение и движение пользователя в пространстве
Вопросы для размышления
- Представьте, что вам нужно обучить хирурга сложной операции. Какую XR-технологию вы бы выбрали (AR, VR или MR) и почему?
- Почему Apple избегает терминов AR/VR и называет Vision Pro устройством «пространственных вычислений»? Какую проблему классификации это решает?
- Где на спектре Милгрэма находится видеозвонок с AR-фильтрами (например, виртуальный фон в Zoom)?