Ни одного американского чипа. Huawei и Zhipu AI создали ИИ вопреки всем санкциям США
NewsMakerКитай научился тренировать мощный ИИ на отечественных процессорах.
Китайская компания Zhipu AI заявила , что обучила новую модель GLM-Image полностью на оборудовании Huawei — без использования американских чипов Nvidia или AMD. По утверждению компании, это первый случай, когда передовая модель была создана исключительно на китайском железе.
Zhipu, которая также известна под брендом Z.ai , специализируется на моделях семейства General Language Model. Новая GLM-Image использует гибридную архитектуру, сочетающую авторегрессивный генератор и диффузионный декодер, что позволяет совместно генерировать изображения и текст.
Для обучения модели использовались серверы Huawei Ascend Atlas 800T A2 с процессорами Kunpeng 920 на базе архитектуры Arm и ИИ-ускорителями Ascend 910. Последняя версия этих ускорителей — Ascend 910C — по заявлениям Huawei , обеспечивает около 800 терафлопс при точности FP16, что составляет примерно 80% от производительности Nvidia H100.
Архитектура GLM-Image включает авторегрессивный генератор на 9 миллиардов параметров и диффузионный декодер на 7 миллиардов параметров. Модель способна создавать изображения высокого разрешения и корректно отрисовывать текст внутри них.
Китайская компания Zhipu AI заявила , что обучила новую модель GLM-Image полностью на оборудовании Huawei — без использования американских чипов Nvidia или AMD. По утверждению компании, это первый случай, когда передовая модель была создана исключительно на китайском железе.
Zhipu, которая также известна под брендом Z.ai , специализируется на моделях семейства General Language Model. Новая GLM-Image использует гибридную архитектуру, сочетающую авторегрессивный генератор и диффузионный декодер, что позволяет совместно генерировать изображения и текст.
Для обучения модели использовались серверы Huawei Ascend Atlas 800T A2 с процессорами Kunpeng 920 на базе архитектуры Arm и ИИ-ускорителями Ascend 910. Последняя версия этих ускорителей — Ascend 910C — по заявлениям Huawei , обеспечивает около 800 терафлопс при точности FP16, что составляет примерно 80% от производительности Nvidia H100.
Архитектура GLM-Image включает авторегрессивный генератор на 9 миллиардов параметров и диффузионный декодер на 7 миллиардов параметров. Модель способна создавать изображения высокого разрешения и корректно отрисовывать текст внутри них.