Claude Opus 4.8: контроль усилий, dynamic workflows и fast-режим втрое дешевле

Anthropic 28 мая 2026 года выпустила Claude Opus 4.8 - обновление флагманской модели. Цена за обычное использование осталась прежней, fast-режим подешевел втрое, а пользователи получили ручной контроль над тем, сколько усилий модель тратит на ответ.
Claude Opus 4.8: контроль усилий, dynamic workflows и fast-режим втрое дешевле

Anthropic называет Opus 4.8 «скромным, но ощутимым шагом» относительно Opus 4.7. Редкая формулировка для индустрии, где каждый релиз продают как прорыв. Главное в обновлении выходит за рамки бенчмарков. Три новых способа взаимодействия с моделью: уровень усилий, динамические воркфлоу в Claude Code и обновлённый Messages API.

Меньше выдуманного кода

Самое заметное изменение касается честности модели. По собственным данным Anthropic, Opus 4.8 примерно в четыре раза реже своего предшественника пропускает без комментариев дефекты в коде, который сам же написал. Раньше модели уверенно сообщали о готовом результате там, где результат был сырым или вовсе ошибочным. Сейчас Opus 4.8 чаще явно отмечает, в чём именно он не уверен.

Команда Anthropic по согласованию (alignment) пишет: по шкале «просоциальных черт» (поддержка автономии пользователя, действия в его интересах) модель ставит новый внутренний рекорд. По уровню рискованного поведения (обман, кооперация с злоупотреблением) Opus 4.8 находится на одном уровне с Claude Mythos Preview, лучшей по этой метрике моделью компании.

Для бизнес-аудитории это понятный сдвиг. В задачах, где LLM пишет код или анализ, модель, которая сама подсвечивает свои дыры, выигрывает у модели, которая молчит. Особенно в долгих автоматических сценариях, где исправлять придётся за ней.

Бенчмарки

Уровень усилий - пользовательский переключатель

В claude.ai и Cowork рядом с выбором модели появился новый переключатель уровня усилий (effort). По умолчанию для Opus 4.8 включён «высокий», пользователь может выбрать «extra» (в Claude Code пишется xhigh) или «max». Чем выше уровень, тем больше токенов модель тратит на размышления и тем точнее результат. Низкие уровни ускоряют ответ и медленнее сжигают лимиты тарифа.

Anthropic пишет, что в кодовых задачах «высокий» уровень по умолчанию расходует столько же токенов, сколько дефолт у Opus 4.7, при заметно лучшем качестве. «Extra» рекомендован для сложных и длинных асинхронных задач. В Claude Code лимиты подняты под более затратные уровни.

Это сдвиг в сторону той же логики, которую несколько лет назад вводил OpenAI с о1-классом моделей: дать пользователю экономный режим и режим «думай дольше». Anthropic делает это спокойнее, без отдельного бренда «reasoning model», просто как ручку настройки.

Dynamic workflows в Claude Code

Claude Code получил функцию динамических воркфлоу - пока в режиме research preview. Модель может разложить большую задачу на сотни параллельных субагентов, проверить их результат и выдать итог. Anthropic приводит в пример миграцию кодовой базы на сотни тысяч строк от старта до мерджа, где порогом успеха служит существующий тестовый набор.

Функция доступна в тарифах Enterprise, Team и Max. Это первый случай, когда Anthropic так открыто говорит про «масштаб всей кодовой базы» в одной сессии. Раньше Claude Code упирался в более скромные размеры задач.

В пресс-релизе нет цифр по успешности таких миграций. Без публичных метрик dynamic workflows пока остаётся заявкой; реальная проверка - на чужих репозиториях в течение нескольких месяцев после релиза.

Fast-режим стал втрое дешевле

Fast mode - ускоренный вариант инференса со скоростью около 2,5× против обычного. Раньше эта опция была заметно дороже стандартной. Теперь для Opus 4.8 fast-режим стоит втрое дешевле, чем у предыдущих моделей: $10 за миллион входных токенов и $50 за выходные. Стандартное использование осталось по прежней цене Opus 4.7: $5 и $25 за миллион токенов.

Это разумный шаг для агентных сценариев: длинные циклы инструментов и поиск по большим контекстам выигрывают от скорости больше, чем разговорные интерфейсы. Если раньше fast mode был премиальной опцией для редких случаев, сейчас он становится рабочей нормой для агентов.

Отдельно для разработчиков: Messages API теперь принимает системные сообщения внутри массива messages. На практике это значит, что в долгой агентной сессии можно менять права, лимиты токенов или контекст окружения без сброса prompt cache и без маскировки апдейтов под пользовательский тёрн.

Что говорят партнёры

Среди ранних тестеров - Cursor, Devin, Databricks, Hebbia, Thomson Reuters CoCounsel, Browser Use, плюс компании из инвестиционного и юридического сегмента. Подбор показателен: основные кейсы лежат там, где модель работает агентно, ходит по инструментам, держит длинный контекст.

Browser Use ставит Opus 4.8 на первое место в задачах computer-use и браузерных агентов: 84% на Online-Mind2Web против Opus 4.7 и GPT-5.5. Cursor говорит про более эффективное использование инструментов: меньше шагов на тот же результат. Devin отдельно отмечает, что в Opus 4.8 исправили проблемы с лишней говорливостью комментариев и шумными tool-calls, которые были в 4.7. Databricks докладывает о 61% удешевлении токенов на анализе PDF и диаграмм в их агенте Genie.

Полезные цифры, но все из «первой волны» партнёров, у которых был ранний доступ. Независимые тесты в публичном поле подъедут позже.

Mythos на подходе

В финале анонса - намёк на следующий класс моделей. Project Glasswing уже использует Claude Mythos Preview в задачах кибербезопасности. Anthropic пишет, что модели такого уровня требуют дополнительных мер защиты до общего релиза, и обещает раскатать Mythos на всех клиентов «в ближайшие недели».

Срок мягкий, но конкретный. Пока Mythos Preview работает в ограниченной группе, Opus 4.8 остаётся лучшим, что Anthropic предлагает массовому пользователю. Когда выйдет Mythos, баланс линейки изменится: текущий «топ» сместится вниз. Это удобная подсказка тем, кто планирует подписки и долгие интеграции: горизонт перепланирования сейчас короткий.

20:25
162
Нет комментариев. Ваш будет первым!