Microsoft уходит от AMD и Nvidia. "Да, абсolutely" — техдиректор подтвердил переход на собственные чипы

Redmond готовит второе поколение чипов для ИИ и инфраструктуры Azure.

Microsoft планирует постепенно отказаться от зависимости от графических процессоров Nvidia и AMD, переключив большую часть своих задач искусственного интеллекта на собственные ускорители.

Компания довольно поздно вошла в гонку по созданию собственных чипов. Пока Amazon и Google уже много лет разрабатывают собственные CPU и AI-ускорители, Microsoft лишь в конце 2023 года представила свой первый чип Maia.

По словам технического директора Microsoft Кевина Скотта, главным фактором при переходе является эффективность затрат — производительность на каждый вложенный доллар. Для облачного провайдера гипермасштаба это, по сути, главный показатель. На встрече, организованной CNBC, Скотт отметил, что до сих пор Nvidia предлагала лучший баланс цены и мощности, но Microsoft готова рассматривать любые решения, которые помогут справиться с растущим спросом.

Отвечая на вопрос, станет ли Microsoft в будущем использовать в своих центрах обработки данных в основном собственные чипы, Скотт сказал: «Да, абсолютно». Он подчеркнул, что компания рассматривает всё в комплексе — от архитектуры сетей до систем охлаждения — и хочет иметь свободу принимать решения, необходимые для оптимальной настройки вычислений под конкретные нагрузки.

Первый чип Maia 100 позволил Microsoft разгрузить часть GPU, переведя работу модели OpenAI GPT-3.5 на собственный ускоритель еще в 2023 году. Однако его характеристики были далеки от уровня решений Nvidia и AMD: производительность 800 терафлопс (BF16), 64 ГБ памяти HBM2e и пропускная способность 1,8 ТБ/с.

Сейчас компания готовит второе поколение ускорителей Maia, которое должно выйти в 2026 году и предложить более конкурентоспособную вычислительную мощность, память и межсоединения. Тем не менее эксперты считают, что полностью отказаться от GPU Microsoft вряд ли удастся — как минимум потому, что клиенты продолжают требовать поддержку решений Nvidia и AMD.

Для сравнения: Google и Amazon уже развернули десятки тысяч собственных TPU и Trainium-чипов, однако в основном используют их для внутренних задач, а не для клиентских проектов. Поэтому графические процессоры по-прежнему занимают значительную долю в инфраструктуре облачных провайдеров.

Помимо AI-ускорителей, Microsoft разрабатывает и другие виды специализированных чипов — например, собственный процессор Cobalt и модули безопасности, ускоряющие криптографию и защиту обмена ключами в масштабах всей корпоративной инфраструктуры.