Девять задач и 56 лет ожидания. ИИ от Google решил проблемы, над которыми бились поколения математиков
NewsMakerGoogle заставил ИИ не просто генерировать ответы, а проверять их.
Искусственный интеллект всё увереннее заходит на территорию, где раньше годами работали только математики. Система Google DeepMind AlphaProof Nexus решила девять открытых задач венгерского математика Пала Эрдеша, причем две из них оставались без ответа 56 лет.
AlphaProof Nexus не просто предложила красивые идеи, а подготовила доказательства, которые можно проверить машинным способом. Для проверки система использовала Lean, специальную среду, где каждый логический шаг должен пройти строгий контроль. Если доказательство не выдерживает проверку, система возвращается и ищет снова.
По данным Google DeepMind, AlphaProof Nexus работала с набором из 353 открытых задач Эрдеша и закрыла девять из них. Задачи относятся к комбинаторике и теории графов. Кроме того, система доказала 44 открытые гипотезы из «Онлайн-энциклопедии целочисленных последовательностей». Стоимость решения каждой задачи, по оценке авторов работы, составила несколько сотен долларов.
Система сочетает большую языковую модель и строгую проверку доказательств. Модель предлагает ход решения, а Lean проверяет, следует ли вывод из предыдущих шагов. Такой подход снижает риск того, что искусственный интеллект выдаст правдоподобный, но неверный ответ.
Результат Google DeepMind появился вскоре после заявления OpenAI о собственном прорыве в задаче Эрдеша, сформулированной в 1946 году. Модель OpenAI нашла новый подход к задаче о точках на плоскости и расстояниях между ними. Несколько математиков уже назвали результат серьезным достижением, хотя работа с такими доказательствами всё равно требует проверки и обсуждения в профессиональном сообществе.
AlphaProof Nexus пока далека от универсального «математика в компьютере». Большинство задач из проверенного набора остались нерешенными, а там, где требовались принципиально новые математические конструкции, система часто не справлялась. Но сам факт, что программа смогла закрыть задачи, которые десятилетиями не поддавались людям, показывает, как быстро меняется роль искусственного интеллекта в науке.
Для математики такой подход может оказаться особенно важным. Искусственный интеллект способен быстро перебирать идеи, а формальная проверка отсеивает ошибочные рассуждения. Вместе два механизма превращают систему не просто в помощника для вычислений, а в инструмент для поиска новых доказательств.
Искусственный интеллект всё увереннее заходит на территорию, где раньше годами работали только математики. Система Google DeepMind AlphaProof Nexus решила девять открытых задач венгерского математика Пала Эрдеша, причем две из них оставались без ответа 56 лет.
AlphaProof Nexus не просто предложила красивые идеи, а подготовила доказательства, которые можно проверить машинным способом. Для проверки система использовала Lean, специальную среду, где каждый логический шаг должен пройти строгий контроль. Если доказательство не выдерживает проверку, система возвращается и ищет снова.
По данным Google DeepMind, AlphaProof Nexus работала с набором из 353 открытых задач Эрдеша и закрыла девять из них. Задачи относятся к комбинаторике и теории графов. Кроме того, система доказала 44 открытые гипотезы из «Онлайн-энциклопедии целочисленных последовательностей». Стоимость решения каждой задачи, по оценке авторов работы, составила несколько сотен долларов.
Система сочетает большую языковую модель и строгую проверку доказательств. Модель предлагает ход решения, а Lean проверяет, следует ли вывод из предыдущих шагов. Такой подход снижает риск того, что искусственный интеллект выдаст правдоподобный, но неверный ответ.
Результат Google DeepMind появился вскоре после заявления OpenAI о собственном прорыве в задаче Эрдеша, сформулированной в 1946 году. Модель OpenAI нашла новый подход к задаче о точках на плоскости и расстояниях между ними. Несколько математиков уже назвали результат серьезным достижением, хотя работа с такими доказательствами всё равно требует проверки и обсуждения в профессиональном сообществе.
AlphaProof Nexus пока далека от универсального «математика в компьютере». Большинство задач из проверенного набора остались нерешенными, а там, где требовались принципиально новые математические конструкции, система часто не справлялась. Но сам факт, что программа смогла закрыть задачи, которые десятилетиями не поддавались людям, показывает, как быстро меняется роль искусственного интеллекта в науке.
Для математики такой подход может оказаться особенно важным. Искусственный интеллект способен быстро перебирать идеи, а формальная проверка отсеивает ошибочные рассуждения. Вместе два механизма превращают систему не просто в помощника для вычислений, а в инструмент для поиска новых доказательств.