Два джойстика, тысячи роботов и один ИИ. Бывший инженер Microsoft устроил нейросети самый хаотичный стресс-тест

Сможет ли ИИ победить в игре, где люди сдавались через секунды?

Бывший инженер Microsoft Дэйв Пламмер взялся за неожиданную задачу: обучить искусственный интеллект играть в Robotron: 2084, аркадный хит 1982 года, где один человек отбивается от бесконечных волн роботов после кибернетического восстания. Задумка выглядит почти насмешкой над самой темой игры, потому что машине предлагают научиться выживать в цифровом мире, построенном вокруг бунта машин. Для Пламмера такой эксперимент уже не первый: раньше разработчик обучил модель уверенно проходить Tempest, еще один классический аркадный шутер начала 1980-х.

С Robotron задача заметно сложнее. Игра давно получила культовый статус благодаря бешеному темпу, постоянному давлению и системе управления с двумя джойстиками, где один отвечает за движение, а второй за стрельбу. Игроку приходится каждую секунду решать сразу несколько конфликтующих задач: спасать людей, уничтожать роботов, уклоняться от атак и постоянно выбирать, какой риск важнее в конкретный момент.

Пламмер описывает Robotron как предельно сжатый тест на принятие решений в реальном времени, который до сих пор не потерял остроты. По его словам, игра проверяет не только реакцию, но и умение расставлять приоритеты под давлением. Искусственному интеллекту в такой среде мало просто уворачиваться от угроз: модели нужно понимать, в какую сторону вообще стоит двигаться, чтобы следующий маневр не оказался еще хуже предыдущего.

Разработчик считает, что Robotron остается одной из самых чистых проверок поведения в условиях перегрузки, когда система должна принимать решения быстро, без полной информации и под непрерывным потоком новых угроз. В таком контексте старая аркада превращается почти в лабораторию, где можно наблюдать разницу между механической реакцией, тактикой и более сложным поведением, похожим на осмысленный выбор. Пламмер добавляет, что старые инженерные решения, связанные с процессорными циклами, структурами данных, режимами вывода графики и эргономикой управления, снова становятся важны, как только за игру берется ИИ.

Как и в случае с Tempest, Пламмер запустил открытую панель, где можно следить за обучением модели вживую. По словам автора эксперимента, старый автомат раскрывается заново, как только в него запускают искусственный интеллект: игра перестает быть музейным экспонатом и снова превращается в активного противника. Судя по замыслу, эксперимент интересен не только поклонникам ретро-аркад, но и тем, кто изучает поведение ИИ в хаотичной среде, где цена ошибки ощущается буквально каждую секунду.