Роботы научились понимать. Не команды — а саму реальность. Google только что пересобрал робототехнику
NewsMakerЧто скрывается за главным обновлением платформы Gemini Robotics-ER 1.6?
Google представила новую модель Gemini Robotics-ER 1.6 , которая должна помочь роботам лучше понимать физический мир, а не просто исполнять команды по шаблону. В центре внимания embodied reasoning — способность машины смотреть на обстановку, понимать происходящее, разбивать задачу на шаги и проверять, доведено ли дело до конца. Для робототехники это заметный сдвиг: робот не только слушается, но и ориентируется по ситуации и быстро меняет стратегию своей работы, если что-то идёт не так.
Новая версия прибавила в пространственном понимании и в работе сразу с несколькими источниками изображения. Робот увереннее определяет, где лежат предметы, как они связаны друг с другом и что видно с разных камер. Это важно в обычной рабочей среде: обзор часто перекрыт, вещи лежат как попало, обстановка меняется прямо во время работы.
Gemini Robotics-ER 1.6 точнее распознаёт объекты, умеет их считать и лучше понимает связи между ними. Модель также может указывать на предметы по ходу рассуждения. За счёт этого сложную задачу проще разложить на понятные действия. На практике это нужно постоянно: пройти через загромождённое помещение, выбрать нужный предмет среди похожих, не потерять уже сделанные шаги.
Google также улучшила проверку результата. Модель лучше понимает, выполнена ли задача правильно. Для автоматизации это один из ключевых моментов. Системе мало просто сделать движение. Нужно ещё понять, хватило ли его, стоит ли повторить попытку или можно идти дальше. Без этой проверки робот либо застрянет на одном месте, либо слишком рано решит, что всё готово.
Google представила новую модель Gemini Robotics-ER 1.6 , которая должна помочь роботам лучше понимать физический мир, а не просто исполнять команды по шаблону. В центре внимания embodied reasoning — способность машины смотреть на обстановку, понимать происходящее, разбивать задачу на шаги и проверять, доведено ли дело до конца. Для робототехники это заметный сдвиг: робот не только слушается, но и ориентируется по ситуации и быстро меняет стратегию своей работы, если что-то идёт не так.
Новая версия прибавила в пространственном понимании и в работе сразу с несколькими источниками изображения. Робот увереннее определяет, где лежат предметы, как они связаны друг с другом и что видно с разных камер. Это важно в обычной рабочей среде: обзор часто перекрыт, вещи лежат как попало, обстановка меняется прямо во время работы.
Gemini Robotics-ER 1.6 точнее распознаёт объекты, умеет их считать и лучше понимает связи между ними. Модель также может указывать на предметы по ходу рассуждения. За счёт этого сложную задачу проще разложить на понятные действия. На практике это нужно постоянно: пройти через загромождённое помещение, выбрать нужный предмет среди похожих, не потерять уже сделанные шаги.
Google также улучшила проверку результата. Модель лучше понимает, выполнена ли задача правильно. Для автоматизации это один из ключевых моментов. Системе мало просто сделать движение. Нужно ещё понять, хватило ли его, стоит ли повторить попытку или можно идти дальше. Без этой проверки робот либо застрянет на одном месте, либо слишком рано решит, что всё готово.