146 раз быстрее за 10 долларов: ИИ теперь оптимизирует алгоритмы лучше человека

Эволюционный агент нашел схему, о которой люди не договорились годами.


730dr8yj2xtrt2dk6hjiqxa40v6a2pnr.jpg

Исследователи из Калифорнийского университета в Беркли заявили, что модели ИИ уже становятся инструментом для поиска и оптимизации алгоритмов. В препринте с говорящим названием Barbarians at the Gate. How AI is Upending Systems Research группа из 17 авторов описывает , как открытая система OpenEvolve, созданная по мотивам AlphaEvolve от Google DeepMind, помогла заметно ускорить алгоритм балансировки нагрузки в системах экспертного параллелизма для больших языковых моделей.

Команда взяла за основу открытый EPLB из проекта DeepSeek. Та реализация работала медленно, поскольку была написана на Python и использовала цикл с линейным поиском подходящего GPU. В среднем перераспределение экспертов занимало около 540 мс. Исследователи также ориентировались на закрытую версию из нераскрытой лаборатории уровня фронтира, где на перебалансировку уходило 19,6 мс. OpenEvolve предложил иной подход к упаковке экспертов по GPU. Модель заменила циклы векторизованными тензорными операциями и ввела зигзагообразное разбиение. Время выполнения сократилось до 3,7 мс. Это пятикратный выигрыш по сравнению с референсом и примерно в 146 раз быстрее реализации DeepSeek. По словам авторов, результат получен за пять часов работы и менее чем за десять долларов, при этом запросы исполнялись смесью из 80 процентов Gemini 2.5 Flash и 20 процентов Gemini 2.5 Flash Lite.

В статье приводится еще одно кейс-исследование. С помощью OpenEvolve ускорена аналитика на отношениях, где SQL-запросы вызывают инференс LLM для каждой строки. Прирост производительности около трех раз. Авторы называют такой подход ADRS, то есть AI-Driven Research for Systems. Суть проста. Модель генерирует гипотезы, проверяет их, затем итеративно улучшает решения. В работе делается вывод, что по мере взросления таких инструментов роль человека будет смещаться к постановке задач и стратегическому управлению.

Контекст в индустрии выглядит обнадеживающим. Весной Google рассказал об успехах AlphaEvolve. Агент на основе эволюционного программирования улучшил оркестрацию в дата-центрах, оптимизировал матричное умножение для TPU и ускорил ядро FlashAttention в трансформерах. В журнале Nature вышла статья авторов из Google DeepMind о самообучающемся поиске правил обучения с подкреплением. Исследователи пытаются показать, что машинный поиск эвристик способен конкурировать с ручными подходами.

Соавтор работы Одри Чэн, аспирантка UC Berkeley, подчеркнула, что вопрос о творчестве ИИ остается открытым, однако на практике новизна в системной и базовой инженерной науке понимается через улучшение метрик. Если алгоритм заметно быстрее или эффективнее, значит он нов. Чэн отмечает, что модели опираются на огромный корпус знаний и иногда находят неожиданные переносы идей между областями. По ее словам, в задачах производительности ИИ уже обгоняет человеческие решения. Такие задачи проще проверять, а примеры внедрения в компаниях уже есть, в том числе у поставщиков наблюдаемости. Главный тормоз сейчас верификация и надежная методика оценки. Когда появятся зрелые рамки для проверки безопасности и отказоустойчивости, подходы ADRS смогут выходить за пределы узкой оптимизации и шире применяться в системном программировании и не только в компьютерных науках.

Работа берклиевской группы показывает важную тенденцию. Поиск удачных алгоритмических решений перестает быть исключительно ручным ремеслом. Человеку остается сформулировать задачу и границы, а дальше итерации и тонкую настройку берет на себя ИИ. Если результаты, подобные ускорению EPLB, будут воспроизводиться в других классах задач, то оптимизация систем станет заметно дешевле и быстрее, а конкуренция переместится в область качества постановки проблемы и качества проверки решений.