Anthropic обновила Claude Managed Agents: Dreaming, многоагентная оркестрация

Anthropic выпустила обновление Claude Managed Agents - облачной платформы для запуска автономных ИИ-агентов. Главное в апдейте - Dreaming, фоновый процесс, который перерабатывает память агента между сессиями. Параллельно появились проверка результата по рубрике (outcomes), многоагентная оркестрация и вебхуки.
Anthropic обновила Claude Managed Agents: Dreaming, многоагентная оркестрация

Dreaming - память агента между рабочими сессиями

Dreaming - плановый процесс. Он просматривает прошлые сессии агента и его хранилища памяти, ищет повторяющиеся шаблоны, извлекает выводы и обновляет память. Разработчик выбирает режим: разрешить автоматическое обновление или сначала проверять предлагаемые изменения вручную.

Anthropic решает одну из самых тяжёлых проблем агентных систем. Агент часто хорошо справляется с отдельной задачей, но плохо переносит опыт на следующую. Dreaming должен находить ошибки, повторяющиеся рабочие маршруты и предпочтения команды, которые в рамках одной сессии остаются незаметными.

Функция запущена в статусе research preview, это предварительный исследовательский доступ - выдаётся по запросу через Claude Platform. Остальные нововведения (outcomes, многоагентная оркестрация, вебхуки и память) доступны в public beta, открытом предварительном доступе.

outcomes - внешний оценщик с собственным контекстом

Вторая крупная функция - outcomes. Разработчик задаёт рубрику: каким должен быть хороший результат, какие требования нужно соблюсти, где проходит планка качества. Затем отдельный оценщик проверяет ответ агента в собственном контекстном окне, не опираясь на рассуждения самого агента.

Если результат не соответствует критериям, оценщик указывает, что нужно исправить, и агент делает новую попытку. Сценарий особенно полезен там, где важны полнота, структура и соответствие внутренним правилам: отчёты, презентации, документы, редакционные материалы, юридические черновики.

По внутренним тестам Anthropic, outcomes повышает успешность выполнения задач. Для файловой генерации зафиксировано +8,4% по docx и +10,1% по pptx. Это данные самого разработчика, независимой проверки в анонсе нет.

Один агент руководит другими

Многоагентная оркестрация позволяет ведущему агенту разбивать сложную задачу на части и поручать их специализированным подагентам. У каждого может быть своя модель, свой промпт и свой набор инструментов.

Anthropic приводит пример с расследованием технической проблемы: главный агент одновременно отправляет подагентов в историю деплоев, журналы ошибок, метрики и обращения поддержки, затем собирает результаты и выделяет закономерности. Все агенты работают параллельно в общей файловой среде.

В Claude Console можно отследить, какой агент что сделал, в каком порядке и по какой причине. Для корпоративных внедрений это критичная деталь. Без трассировки агентная автоматизация быстро превращается в непрозрачный ящик, а любые претензии к качеству утыкаются в невозможность разобраться в цепочке шагов.

Кейсы: Harvey, Netflix, Spiral, Wisedocs

Anthropic уже приводит несколько примеров.

Юридическая платформа Harvey тестировала Dreaming на длинных черновиках и работе с документами. Агенты запоминали обходные приёмы по форматам файлов и шаблоны работы с конкретными инструментами. По данным компании, показатель завершения задач вырос примерно в шесть раз.

Платформенная команда Netflix построила агента для анализа логов из сотен сборок. В таком сценарии ценность даёт не отдельный сбой, а поиск повторяющихся проблем, которые задевают тысячи приложений. Многоагентная схема позволяет распараллелить разбор и вывести наверх только значимые паттерны.

Spiral от Every использует оркестрацию и outcomes для пишущего агента в API и CLI. Ведущий агент работает на Haiku, задаёт уточняющие вопросы и передаёт черновики подагентам на Opus. Качество проверяется по редакционным принципам Every и голосу пользователя, подтянутым из памяти.

Wisedocs построила агента для проверки качества документов. По данным Anthropic, проверки стали выполняться на 50% быстрее. Сверка результата с внутренними правилами команды при этом сохраняется.

Продолжение апрельского запуска Managed Agents

Claude Managed Agents вышли в public beta 8 апреля 2026 года. Anthropic описала их как набор API для создания облачных агентов с управляемой инфраструктурой: песочницей выполнения кода, долгими сессиями, разрешениями, трассировкой и управлением инструментами.

23 апреля компания добавила встроенную память для Managed Agents - в виде файлов, которые разработчик может экспортировать, читать и изменять через API. Майское обновление надстраивается над этой памятью: агент периодически возвращается к накопленному опыту и обновляет память сам.

В подходе Anthropic виден сдвиг. Компания продвигает инфраструктурный слой для длительной агентной работы: память, контроль качества, распределение задач, уведомления, аудит действий. От «умного чат-бота» как самостоятельного продукта Anthropic уходит - её ставка ближе к корпоративному программному слою, чем к интерфейсу вопрос-ответ.

Где остаются открытые вопросы

Самые громкие цифры в анонсе - шестикратный рост завершения задач у Harvey и приросты outcomes во внутренних бенчмарках Anthropic. Они выглядят сильными, но завязаны на конкретные сценарии, настройки и методику измерения. В широком использовании результаты могут расходиться.

Есть и управленческий риск. Агент, который сам обновляет память, способен закреплять удачные практики, но точно так же может сохранить и ошибочные привычки. Поэтому ручной режим проверки изменений в Dreaming может оказаться важнее, чем читается по маркетинговому описанию.

Для разработчиков главный сигнал понятен: конкуренция в агентных платформах смещается с мощности модели к качеству обвязки вокруг неё. Если агент должен работать часами, ходить по инструментам и отвечать за результат, ему нужны память, проверяемые критерии успеха и журнал действий. Anthropic делает ставку именно на этот слой.

21:20
106
Нет комментариев. Ваш будет первым!