Сотни агентов в одной задаче и скрытая нейросеть для кибербезопасности. Anthropic выпустила Claude Opus 4.8

Anthropic утверждает, что новая модель в четыре раза реже молча пропускает дефекты в написанном ею коде.


hdpwrbfagedkv23xzioxel7j5ov5bg1c.jpg


Anthropic выпустила Claude Opus 4.8 и заявила, что в собственных тестах модель примерно в четыре раза реже, чем Opus 4.7, оставляет без замечаний дефекты в написанном ею коде.

Claude Opus 4.8 пришла на смену выпущенной ранее версии Opus 4.7. По данным Anthropic, модель лучше справляется с программированием, длительными задачами, работой с инструментами и профессиональными сценариями, где требуется не только выдать результат, но и проверить собственные выводы. Участники раннего тестирования также сообщали, что Claude чаще указывает на сомнения, замечает проблемы во входных данных и реже делает неподтверждённые заявления о проделанной работе.

Вместе с моделью Anthropic запустила управление глубиной ответа в claude.ai и Cowork. Пользователь может выбрать, сколько вычислительных ресурсов Claude потратит на задачу. Низкие настройки ускоряют ответ и медленнее расходуют лимиты, высокие предназначены для сложного анализа и длительной работы. По умолчанию Opus 4.8 использует высокий уровень усилий, а для наиболее трудных задач компания предлагает режимы extra и max.

Claude Code получил функцию Dynamic Workflows в режиме исследовательского предварительного доступа. Новый механизм позволяет модели разбить крупную задачу на части, запустить сотни параллельных вспомогательных агентов в одной сессии, а затем проверить общий результат. Anthropic приводит в пример перенос крупных кодовых баз, где Claude Code может провести изменения в сотнях тысяч строк и ориентироваться на существующий набор тестов перед выдачей результата. Функция доступна в Claude Code для тарифов Enterprise, Team и Max.

Для разработчиков компания добавила ещё одно изменение: Messages API теперь принимает системные инструкции внутри массива сообщений. Такой механизм позволяет менять разрешения, лимиты токенов или сведения об окружении во время выполнения задачи, не выдавая обновление за сообщение пользователя и не сбрасывая кэш запроса.

Claude Opus 4.8 доступна через API под идентификатором claude-opus-4-8. Обычная стоимость не изменилась по сравнению с Opus 4.7 и составляет $5 за миллион входных токенов и $25 за миллион выходных. Быстрый режим, в котором модель работает в 2,5 раза быстрее, стоит $10 за миллион входных и $50 за миллион выходных токенов. Anthropic утверждает, что цена быстрого режима стала втрое ниже, чем у предыдущих моделей.

Отдельно Anthropic раскрыла планы по более мощным моделям класса Mythos. Небольшое число организаций уже тестирует Claude Mythos Preview в задачах кибербезопасности в рамках проекта Glasswing. Компания не открыла широкий доступ к модели из-за возможных киберрисков и заявила, что рассчитывает предоставить модели класса Mythos всем клиентам в ближайшие недели, когда будут готовы усиленные меры защиты.