Аспирант из машины. OpenAI показала GPT-5.2, которая решает задачи лучше живых ученых.

Вместо простой выдачи числа на экране модель строит структурированные аргументы, которые можно обсуждать, уточнять и превращать в полноценные научные работы.


97as6xoay20n27louc8qb9i2420fssgp.jpg

Искусственный интеллект все чаще выступает не как помощник по бытовым мелочам, а как реальный участник научных исследований. OpenAI представила модель GPT-5.2, которую в компании называют своим самым сильным инструментом для работы с математикой и наукой: она уже помогает исследователям решать задачи уровня продвинутых курсов и даже закрывать открытые проблемы.

По словам OpenA I, GPT-5.2 Pro и GPT-5.2 Thinking сейчас считаются их лучшими моделями для научных и технических задач. Они лучше держат в голове длинные цепочки рассуждений, аккуратнее обращаются с числами и уменьшают вероятность тех самых мелких логических ошибок, которые в реальных расчетах превращаются в большие проблемы - от статистики и моделирования до сложных симуляций.

Компания подчеркивает, что усиление именно математического мышления повышает общую надежность моделей. Речь не только о том, чтобы правильно считать интегралы, а о более общей способности к абстракции и строгой логике. Это напрямую связано с тем, что обычно называют движением в сторону более общего интеллекта: система, которая умеет последовательно рассуждать, переносить знания между областями и сохранять внутреннюю непротиворечивость, гораздо полезнее для науки и инженерии, чем набор отдельных "трюков".

На бенчмарках это выглядит впечатляюще. На GPQA Diamond, это набор вопросов уровня аспиранта, специально составленный так, чтобы его нельзя было "нагуглить", GPT-5.2 Pro набирает 93,2 %, а GPT-5.2 Thinking почти не отстает с результатом 92,4 %. На тесте FrontierMath, который оценивает умение решать задачи по математике экспертного уровня, GPT-5.2 Thinking устанавливает новый рекорд, справляясь с 40,3 % задач при максимальном уровне "усилий" по рассуждению и с доступом к Python.