Anthropic выпустила Claude Opus 4.7 для кода и агентных задач

Новый публичный флагман
Anthropic представила Claude Opus 4.7 и сразу открыла доступ к модели в собственном сервисе Claude, через API, а также на платформах Amazon Bedrock, Google Vertex AI и Microsoft Foundry. Цена осталась прежней: 5 долларов за миллион входных токенов и 25 долларов за миллион выходных.
Компания подаёт Opus 4.7 как свой новый публичный флагман. Но здесь есть важная оговорка, которую Anthropic не прячет: речь идёт именно о самой сильной общедоступной модели. Более мощный Mythos Preview у компании уже есть, однако он пока остаётся закрытым продуктом для ограниченного круга партнёров.
Это важный нюанс для рынка. Обычно разработчики стараются говорить о каждом новом релизе как о безусловном лидере, но в случае с Opus 4.7 акцент смещён в другую сторону. Anthropic фактически говорит, что выпускает не максимальную по возможностям систему, а наиболее зрелую и безопасную версию, которую готова отдать в массовое использование.
Где модель стала лучше
Главная идея релиза: Claude Opus 4.7 сделали не для эффектных коротких ответов, а для длинной и более сложной работы. В анонсе Anthropic отдельно выделяет четыре направления, в которых модель прибавила: программирование, многошаговые агентные сценарии, анализ изображений и более точное следование инструкциям.
Если переводить это на обычный язык, компания обещает, что Opus 4.7 должна увереннее работать там, где модель не просто отвечает на вопрос, а выполняет цепочку действий. Например, разбирает проектный код, ищет ошибку, предлагает исправление, проверяет результат и только после этого возвращает ответ. Именно такие задачи сейчас считаются для ИИ-моделей самыми ценными в прикладной разработке.
Anthropic отдельно подчёркивает, что новая версия лучше держит длинный контекст и аккуратнее завершает задачи, не бросая их на полпути. Для корпоративных пользователей это, пожалуй, важнее, чем любые яркие маркетинговые формулировки: бизнесу нужен ИИ, который не просто «умеет», а стабильно доводит работу до результата.
Что говорят бенчмарки
В релизных материалах сильнее всего выделяется блок, связанный с программированием. На SWE-bench Verified модель показала результат 87,6%. Это один из самых заметных бенчмарков для оценки ИИ в реальных задачах разработки, где проверяется не абстрактная эрудиция, а способность разобраться в существующем коде и предложить рабочее исправление.
На Terminal-Bench 2.0 Claude Opus 4.7 набрала 69,4%. Этот тест нужен для оценки того, насколько уверенно модель действует в терминальной среде: понимает последовательность команд, не теряет шаги и корректно работает с инструментами. Для агентных систем это особенно важный показатель, потому что именно там ИИ должен не рассуждать в отрыве от среды, а взаимодействовать с ней.
Сами по себе проценты без контекста мало что говорят широкой аудитории. Но здесь важно другое: Anthropic показывает, что основной прогресс идёт в сторону инженерной полезности. Opus 4.7 продвигают не как модель для красивых тестовых диалогов, а как инструмент для работы с кодом, файлами, командами и длинными цепочками действий.

Улучшения для работы с изображениями
Заметное обновление получила и визуальная часть модели. В документации Anthropic сказано, что Claude Opus 4.7 поддерживает изображения до 2576 пикселей по длинной стороне, тогда как у Opus 4.6 этот предел составлял 1568 пикселей. То есть модель рассчитана на более детальный разбор скриншотов, интерфейсов, таблиц, диаграмм и документов.
На практике это выглядит как шаг в сторону более серьёзной офисной и инженерной работы. Чем выше допустимое разрешение, тем меньше вероятность, что мелкие элементы интерфейса, текст на изображении или детали схемы будут потеряны ещё на входе. Для тех, кто использует ИИ для анализа экранов, отчётов или технической документации, это вполне прикладное улучшение.
Что изменилось для разработчиков
Есть и менее заметные, но важные изменения. Anthropic обновила токенизатор, и в документации прямо говорится, что в ряде случаев расход токенов у Opus 4.7 может оказаться выше, чем у Opus 4.6. Это значит, что командам, которые уже посчитали экономику использования модели, придётся заново проверить стоимость типовых сценариев.
Ещё одно изменение касается режима thinking. Теперь его содержимое по умолчанию скрыто, если пользователь или разработчик не включил показ отдельно. Для части аудитории это техническая деталь, но на практике она влияет и на интерфейс, и на ожидания от работы модели, особенно в тех продуктах, где важна прозрачность промежуточных шагов.
Почему Anthropic так много говорит о безопасности
Отдельный сюжет вокруг Opus 4.7 связан с безопасностью. Anthropic прямо пишет, что релиз стал частью более осторожного подхода к публикации мощных моделей. Компания тестирует новые защитные механизмы для киберсценариев и поэтому выводит в широкий доступ не самый сильный внутренний вариант, а модель, которую считает более контролируемой.
Этот акцент подтверждают и сторонние публикации. The Verge отмечает, что Anthropic фактически использует Opus 4.7 как безопасный промежуточный шаг перед более широким развёртыванием систем класса Mythos. Параллельно компания запустила Cyber Verification Program - отдельную программу для специалистов по безопасности, которым нужен более легитимный доступ к исследованиям и тестам, связанным с киберрисками.
Как рынок встретил релиз
В X официальный аккаунт Anthropic повторил основные тезисы запуска: длинные задачи, лучшее зрение, более точное следование инструкциям и усиление прикладных сценариев. Почти сразу после этого в ленте появились и практические комментарии пользователей, связанные уже не с маркетингом, а с реальным развёртыванием модели в сервисах и инструментах.
Часть обсуждений свелась к тому, что Opus 4.7 не везде мгновенно появилась в пользовательских интерфейсах, хотя уже была доступна по идентификатору модели. Для больших облачных релизов это обычная история: инфраструктура обновляется быстрее, чем отдельные панели и интеграции. AWS со своей стороны отдельно подтвердила запуск модели в Bedrock и перечислила стартовые регионы, где она стала доступна в первый день.
Появились и первые сигналы от партнёров. Например, CodeRabbit сообщил, что в его внутренних тестах Claude Opus 4.7 лучше находит реальные баги и даёт более полезные замечания в code review. Это не универсальная истина и не академический стандарт, но для корпоративного рынка такие отзывы важны: они показывают, как модель ведёт себя не в лаборатории, а в реальном рабочем процессе.
Что это значит для рынка ИИ
Выход Claude Opus 4.7 показывает, куда сейчас движется рынок больших моделей. Конкуренция постепенно смещается от витринных сравнений к более приземлённым критериям: насколько уверенно модель пишет код, справляется с агентными задачами, работает с инструментами, понимает изображения и не срывается на длинной дистанции.
Поэтому главный смысл релиза не в том, что Anthropic объявила о «самом умном ИИ», а в том, что компания выпустила сильную рабочую модель и одновременно честно обозначила её рамки. Opus 4.7 выглядит как инструмент для тех, кому нужен не вау-эффект, а надёжный помощник для кода, документов, скриншотов и сложных многошаговых задач.


