Больше не нужно программировать каждый чих: этот ИИ сам разберется, как взять чашку и не разбить её

NVIDIA заменила кучу скриптов одной моделью, которая реально понимает физику.

NVIDIA представила Cosmos Policy , новый способ управлять роботами, который вырастает из идеи «мировых моделей» для физического ИИ. Смысл подхода в том, чтобы упростить принятие решений: вместо сложных наборов отдельных алгоритмов компания предлагает одну модель, которая одновременно понимает, что происходит вокруг, прогнозирует развитие ситуации и выбирает действия.

В робототехнике «политикой» называют слой, который переводит данные с камер и датчиков в реальные движения: повороты суставов, захваты, перемещения. Обычно такие системы собирают из нескольких частей. Отдельно идет распознавание, отдельно планирование, отдельно управление. Почти всегда под каждую задачу делают свою нейросеть , долго настраивают ее под конкретного робота и среду, обучают на больших объемах размеченных данных. При смене условий все приходится адаптировать заново.

Cosmos Policy работает иначе. NVIDIA берет уже обученную видеомодель Cosmos Predict, которая умеет предсказывать, как со временем меняется физический мир. Она обучалась на больших массивах видео и уже понимает движение объектов и взаимодействия в пространстве. Затем эту модель дообучают на записях того, как люди управляют роботами. Внутрь модели встраиваются действия, состояния системы и результаты задач. В итоге она начинает не просто наблюдать происходящее, а сразу предсказывать, какое действие нужно выполнить и к чему оно приведет.

Одна модель сразу решает несколько задач: выбирает действие, прогнозирует будущее состояние и оценивает, приведет ли это к успешному результату. Не нужно связывать между собой разные нейросети для зрения, планирования и управления. Вся логика работает в одной системе, что делает архитектуру проще и понятнее.

Испытания на стандартных тестах показали, что подход работает не только на бумаге. Cosmos Policy справляется с задачами, где важно учитывать не только текущий шаг, но и то, что произойдет дальше. В ряде случаев результаты оказываются сопоставимыми или даже лучше, чем у существующих решений , при этом системе нужно заметно меньше обучающих примеров. Для робототехники это критично: сбор реальных данных всегда долгий, дорогой и организационно сложный процесс.

Еще одна важная особенность Cosmos Policy в том, что система умеет думать наперед, а не просто реагировать на происходящее. Модель просчитывает несколько вариантов действий, оценивает, к чему каждый из них приведет, и выбирает наиболее надежный. Робот в таком режиме действует не «по ситуации», а с учетом будущих шагов. Подход проверяли не только в симуляциях, но и на реальных роботах . В экспериментах машины выполняли длинные последовательности действий, ориентируясь только на изображение с камер.

Cosmos Policy входит в экосистему NVIDIA Cosmos, где компания развивает универсальные модели для роботов и автономных систем. Смысл этой идеи в том, чтобы дать машинам общее понимание физического мира и базовую логику работы, а не собирать каждую систему вручную под конкретную задачу. Cosmos Policy здесь закрывает именно техническую сторону управления, не затрагивая вопросы безопасности и регулирования.

По сути, NVIDIA предлагает унифицировать тот уровень, где ИИ принимает решения и превращает их в реальные движения. Это хорошо показывает направление, в котором движется отрасль: от набора разрозненных решений к более универсальным моделям, которые можно адаптировать под разные задачи, условия и платформы.