Контекстное окно в 1 млн токенов: Anthropic выпустила модель, которая ничего не забывает.

Claude Opus 4.6 официально мощнее GPT-5.2.


ghus1ficn6jeuy6ndcsdenygsh7r2emq.jpg

Компания Anthropic выпустила обновление своей флагманской модели искусственного интеллекта. Новый Claude Opus 4.6 заметно превосходит предшественника в программировании, автономной работе и решении сложных задач, а также впервые получил контекстное окно на миллион токенов.

Разработчики особо отмечают улучшенные способности модели в написании кода. Opus 4.6 тщательнее планирует работу, дольше справляется с автономными задачами, увереннее ориентируется в крупных кодовых базах и лучше проверяет собственный код на ошибки. Модель показала лучший результат в индустрии на тесте Terminal-Bench 2.0, оценивающем способности ИИ к автономному программированию.

Новые возможности пригодятся не только программистам. Opus 4.6 эффективно справляется с повседневными рабочими задачами — проводит финансовый анализ, выполняет исследования, работает с документами, таблицами и презентациями. В приложении Cowork, где Claude может самостоятельно выполнять несколько задач одновременно, модель применяет все эти навыки без постоянного контроля со стороны пользователя.

Результаты тестирования впечатляют. На экзамене Humanity's Last Exam, проверяющем способность к сложным междисциплинарным рассуждениям, Opus 4.6 опередил все конкурирующие модели. На тесте GDPval-AA, оценивающем работу с экономически значимыми задачами в финансах, праве и других областях, новая модель превзошла ближайшего конкурента GPT-5.2 от OpenAI на 144 пункта Эло, а собственного предшественника Claude Opus 4.5 — на 190 пунктов. Модель также показала лучший результат на BrowseComp — тесте способности находить труднодоступную информацию в интернете. Кроме того, Opus 4.6 продемонстрировал высочайший результат в индустрии на тесте DeepSearchQA, который оценивает способность к глубокому многошаговому агентному поиску информации.