Запускайте хоть на калькуляторе. Google сделала мощный ИИ, которому не нужны суперкомпьютеры

Google представила семейство моделей для смартфонов, ноутбуков и рабочих станций с упором на рассуждение, код и агентные сценарии


dn1win74b571n3ad0r117n4o7hmc0ox7.jpg

Google показала Gemma 4 и сразу подняла планку для открытых ИИ-моделей. Новая линейка, по словам компании, стала самой сильной в семействе Gemma и научилась решать более сложные задачи без гигантских требований к железу. Главная ставка здесь не на грубый рост размеров, а на эффективность: Google утверждает, что Gemma 4 обходит открытые модели, которые крупнее в двадцать раз.

Линейка получила четыре версии: Effective 2B, Effective 4B, 26B Mixture of Experts и 31B Dense. Все модели рассчитаны не только на чат, но и на многошаговые рассуждения, работу с агентными сценариями и выполнение сложных команд. По данным Google, версия 31B сейчас занимает третье место среди открытых моделей в текстовом рейтинге Arena AI, а 26B находится на шестой строчке.

Компания подает Gemma 4 как семейство моделей, которое можно запускать почти на любом уровне техники — от смартфонов и одноплатных компьютеров до рабочих станций и серверных ускорителей. Младшие версии E2B и E4B создавали с прицелом на мобильные устройства и периферийные сценарии. Google обещает низкие задержки, экономию памяти и аккумулятора, а также полноценную мультимодальность. Модели умеют работать с изображениями и видео, а E2B и E4B вдобавок поддерживают нативный аудиоввод для распознавания и понимания речи.

Старшие варианты ориентированы на исследователей и разработчиков, которым нужен мощный локальный ИИ без обязательной привязки к облаку. Google пишет, что нежатые веса в формате bfloat16 помещаются на одной NVIDIA H100 с 80 ГБ памяти, а квантизированные сборки можно запускать и на потребительских видеокартах. Версия 26B MoE ускоряет вывод за счет того, что во время инференса активирует лишь 3,8 млрд параметров из общего объема, а 31B Dense делает ставку на максимальное качество и подходит как база для дообучения.