Калифорнийская компания Figure представила Helix — универсальную модель «зрение-язык-действие» (VLA), которая объединяет восприятие, понимание языка и контроль движений. Helix позволяет роботам рассуждать, понимать голосовые команды и манипулировать предметами без дополнительного обучения или сложного кода. Основатель Figure Бретт Эдкок называет Helix крупнейшим прорывом в истории компании.

Helix управляет верхней частью тела гуманоидного робота, контролируя движения рук, пальцев, головы и туловища с высокой точностью. Роботы с Helix способны работать в паре, координируя действия для выполнения сложных задач — от поднятия незнакомых предметов до совместной работы над общими задачами. Система поддерживает подсказки на естественном языке, делая взаимодействие интуитивно понятным.

Ключевая особенность Helix — уникальная архитектура, разделённая на две системы: S2, отвечающую за понимание сцен и речи, и S1 — за мгновенное выполнение движений. Такой подход позволяет роботам быстро реагировать на команды, одновременно анализируя сложные задачи в фоновом режиме.

Для обучения Helix использовались 500 часов телеуправляемых данных, что дало системе возможность обобщать навыки и подбирать тысячи незнакомых предметов с разными формами и материалами. Helix работает на встроенных маломощных графических процессорах, что делает технологию доступной для коммерческого применения.

Figure утверждает, что Helix — это шаг к созданию роботов, способных действовать в реальных домашних условиях без сложной настройки и программирования. Компания считает, что в будущем такие роботы смогут стать полноценными помощниками в быту.