Робототехника
Grasping и Manipulation
Amazon обрабатывает 37 миллионов посылок в день. Главный узкий путь - захват произвольного объекта из корзины. В 2012 году лучшие промышленные роботы справлялись примерно с 40% объектов на полигоне Amazon Picking Challenge. К 2023 году результат - 95%+. Разрыв закрыли три вещи: планирование захвата на основе нейросетей, силовое управление и тактильные сенсоры.
- **Amazon Robotics Sparrow** - первый манипулятор Amazon с AI-планированием захвата, способный работать с более чем 65 миллионами различных товаров на складах.
- **Boston Dynamics Spot** использует impedance control во всех суставах ног - это позволяет ходить по обломкам, снегу и ступеням без явного знания поверхности.
- **Surgical robots (Da Vinci)** оснащены силовыми датчиками с тактильной обратной связью: хирург чувствует ткань через телеоператорный интерфейс с масштабированием силы.
Планирование захвата
Человек в два года хватает предметы без раздумий. Промышленный робот начала 2000-х за это же время делал 3D-скан объекта, строил геометрическую модель, вычислял точки контакта и всё равно ронял деталь при малейшем отклонении. Планирование захвата - одна из труднейших задач робототехники. Корень проблемы в нестабильности контакта: сила трения зависит от материала, влажности, точности позиционирования. Аналитические подходы строят граспы из условий силового замыкания (force closure) - захват стабилен, если любое внешнее воздействие может быть компенсировано силами реакции в точках контакта. GraspIt! и OpenRAVE реализуют эти алгоритмы. Но реальный мир не знает об аналитических моделях: Google DeepMind Robotics за 700 000 реальных попыток обучила сеть обходить всю геометрию - Grasp Quality CNN оценивает вероятность успешного захвата напрямую из RGB-D изображения.
Force closure: захват замкнут по силе, если матрица Грасмана G^T полного ранга и внутренние силы контактов могут уравновесить произвольную внешнюю нагрузку. Качество захвата Q = min(lambda_i(GG^T)) - минимальное собственное число граммиана. Чем выше Q, тем стабильнее захват. Wrench space: пространство 6D векторов (сила + момент), которое должно охватывать единичный шар.
Что такое force closure и почему это свойство важно для оценки качества захвата?
Силовое управление
Позиционное управление говорит роботу: «Двигайся в точку X». При встрече с твёрдой поверхностью такой контроллер создаёт огромные силы - деталь ломается или робот ломается. Силовое управление переключает парадигму: «Прикладывай силу F». Для сборки, полировки, стоматологии, хирургии - это не опция, а требование. Impedance control (Хоган, 1985) - золотой стандарт: робот ведёт себя как виртуальная пружина-демпфер. При контакте вместо абсолютной позиции управляет соотношением силы и отклонения: F = K*(x_d - x) + D*(v_d - v). Коэффициент жёсткости K можно варьировать от нуля (полностью мягкий) до бесконечности (чисто позиционный). Boston Dynamics Spot использует impedance control для ходьбы по неровным поверхностям.
Два режима: force control (управление по силе, позиция свободна) и position control (управление по позиции, сила свободна). Impedance control обобщает оба: M*(a_d - a) + D*(v_d - v) + K*(x_d - x) = F_ext. Параметры M, D, K задают виртуальную инерцию, демпфирование и жёсткость. Force/torque сенсор (6-axis F/T sensor) измеряет все 6 компонент нагрузки на запястье.
Почему impedance control предпочтительнее чистого position control при контактных задачах?
Пассивная и активная комплаентность
Часовщик вставляет шестерёнку в механизм без приборов: руки сами «чувствуют» правильное положение через упругость инструмента. Это пассивная комплаентность - механическая гибкость, встроенная в конструкцию. RCC (Remote Center Compliance) устройство для сборки вал-втулка работает именно так: упругая вставка в инструменте компенсирует небольшое рассогласование без сенсоров и вычислений. Активная комплаентность - то же самое, но через управление: серводвигатели создают нужную «мягкость» программно. Series Elastic Actuators (SEA) - ключевая инновация: пружина между двигателем и звеном позволяет измерять и регулировать силу с высокой точностью. Atlas (Boston Dynamics) и Cassie (Agility Robotics) используют SEA именно для достижения комплаентной ходьбы по неровным поверхностям.
Пассивная комплаентность: встроенные упругие элементы (RCC, SEA, гибкие суставы). Активная: impedance/admittance control через актуаторы. Admittance control - двойственен impedance: вместо F -> x делает измеренную F -> желаемое x (применяется когда сенсор силы есть, но нет прямого силового управления приводом). Variable Impedance Actuators (VIA) меняют жёсткость механически - крайне энергоэффективны для ударных задач.
В чём принципиальная разница между impedance control и admittance control?
Тактильное восприятие
Рука человека имеет около 17 000 механорецепторов на ладони. Каждый из них - специализированный тактильный сенсор: Меркеля для статического давления, Мейснера для скольжения, Пачини для вибраций. GelSight (MIT, 2009) произвёл революцию: гелевый палец с камерой внутри видит деформацию контактной поверхности с разрешением до микрон. Digit (Meta AI) - портативная версия GelSight, теперь доступная для исследований. Тактильные данные решают задачи, недоступные для зрения: обнаружение скольжения за 2 мс до того как объект упадёт, оценка жёсткости ткани, различение фактуры материалов. Команда Stanford использовала тактильные сенсоры для обучения карточных фокусов - перемешивание колоды жёсткими пальцами роботов.
Типы тактильных сенсоров: capacitive (массивы конденсаторов), piezoelectric (заряд от деформации), optical (GelSight, Digit), barometric (матрица барометров - BMP388). Ключевые метрики: пространственное разрешение (мм), динамический диапазон (Па), частота опроса (Гц). GelSight: ~0.1 мм разрешение, Digit: 30 fps RGB + нормали поверхности.
Тактильные сенсоры нужны только для мягких объектов - для твёрдых деталей достаточно позиционного управления
Тактильное восприятие критично для любых объектов: оно обнаруживает скольжение за 2-5 мс, позволяет оценить жёсткость и трение, и незаменимо при неопределённости позиционирования - что есть всегда в реальных сценах
Даже металлическая деталь имеет допуски на позицию, разное покрытие и вес. Позиционный контроллер не «знает», взята ли деталь на самом деле. Тактильный сенсор это чувствует немедленно - именно поэтому Amazon Robotics интегрировала тактильные сенсоры в своих складских манипуляторов.
Какой тип информации тактильный сенсор GelSight предоставляет, недоступный обычной RGB камере?
Ключевые идеи
- **Force closure** - аналитическое условие стабильности захвата: силы реакции в точках контакта должны уравновешивать произвольную внешнюю нагрузку.
- **Impedance control** - золотой стандарт контактных задач: робот ведёт себя как виртуальная пружина-демпфер, ограничивая контактные силы при отклонении от траектории.
- **SEA и passive compliance** встраивают упругость механически - это надёжнее и быстрее активного управления при высокочастотных возмущениях.
- **Тактильные сенсоры** (GelSight, Digit) предоставляют 3D-карту контакта и обнаруживают скольжение за миллисекунды - информация, недоступная камерам.
Связанные темы
Grasping and Manipulation связан с RL и сенсорикой:
- RL для роботов — Dex-Net и другие системы обучают политики захвата через RL с тактильной обратной связью
- Кинематика и динамика — Силовое управление требует понимания матрицы Якоби и динамической модели манипулятора
Вопросы для размышления
- Почему force closure - необходимое, но недостаточное условие стабильного захвата в реальных условиях?
- Как выбрать между impedance и admittance control для конкретной роботизированной задачи?
- Что мешает тактильным сенсорам стать стандартом в промышленных манипуляторах и как это может измениться с падением их стоимости?