Anthropic обновила Claude Managed Agents: Dreaming, многоагентная оркестрация

Dreaming - память агента между рабочими сессиями
Dreaming - плановый процесс. Он просматривает прошлые сессии агента и его хранилища памяти, ищет повторяющиеся шаблоны, извлекает выводы и обновляет память. Разработчик выбирает режим: разрешить автоматическое обновление или сначала проверять предлагаемые изменения вручную.
Anthropic решает одну из самых тяжёлых проблем агентных систем. Агент часто хорошо справляется с отдельной задачей, но плохо переносит опыт на следующую. Dreaming должен находить ошибки, повторяющиеся рабочие маршруты и предпочтения команды, которые в рамках одной сессии остаются незаметными.
Функция запущена в статусе research preview, это предварительный исследовательский доступ - выдаётся по запросу через Claude Platform. Остальные нововведения (outcomes, многоагентная оркестрация, вебхуки и память) доступны в public beta, открытом предварительном доступе.
outcomes - внешний оценщик с собственным контекстом
Вторая крупная функция - outcomes. Разработчик задаёт рубрику: каким должен быть хороший результат, какие требования нужно соблюсти, где проходит планка качества. Затем отдельный оценщик проверяет ответ агента в собственном контекстном окне, не опираясь на рассуждения самого агента.
Если результат не соответствует критериям, оценщик указывает, что нужно исправить, и агент делает новую попытку. Сценарий особенно полезен там, где важны полнота, структура и соответствие внутренним правилам: отчёты, презентации, документы, редакционные материалы, юридические черновики.
По внутренним тестам Anthropic, outcomes повышает успешность выполнения задач. Для файловой генерации зафиксировано +8,4% по docx и +10,1% по pptx. Это данные самого разработчика, независимой проверки в анонсе нет.
Один агент руководит другими
Многоагентная оркестрация позволяет ведущему агенту разбивать сложную задачу на части и поручать их специализированным подагентам. У каждого может быть своя модель, свой промпт и свой набор инструментов.
Anthropic приводит пример с расследованием технической проблемы: главный агент одновременно отправляет подагентов в историю деплоев, журналы ошибок, метрики и обращения поддержки, затем собирает результаты и выделяет закономерности. Все агенты работают параллельно в общей файловой среде.
В Claude Console можно отследить, какой агент что сделал, в каком порядке и по какой причине. Для корпоративных внедрений это критичная деталь. Без трассировки агентная автоматизация быстро превращается в непрозрачный ящик, а любые претензии к качеству утыкаются в невозможность разобраться в цепочке шагов.
Кейсы: Harvey, Netflix, Spiral, Wisedocs
Anthropic уже приводит несколько примеров.
Юридическая платформа Harvey тестировала Dreaming на длинных черновиках и работе с документами. Агенты запоминали обходные приёмы по форматам файлов и шаблоны работы с конкретными инструментами. По данным компании, показатель завершения задач вырос примерно в шесть раз.
Платформенная команда Netflix построила агента для анализа логов из сотен сборок. В таком сценарии ценность даёт не отдельный сбой, а поиск повторяющихся проблем, которые задевают тысячи приложений. Многоагентная схема позволяет распараллелить разбор и вывести наверх только значимые паттерны.
Spiral от Every использует оркестрацию и outcomes для пишущего агента в API и CLI. Ведущий агент работает на Haiku, задаёт уточняющие вопросы и передаёт черновики подагентам на Opus. Качество проверяется по редакционным принципам Every и голосу пользователя, подтянутым из памяти.
Wisedocs построила агента для проверки качества документов. По данным Anthropic, проверки стали выполняться на 50% быстрее. Сверка результата с внутренними правилами команды при этом сохраняется.
Продолжение апрельского запуска Managed Agents
Claude Managed Agents вышли в public beta 8 апреля 2026 года. Anthropic описала их как набор API для создания облачных агентов с управляемой инфраструктурой: песочницей выполнения кода, долгими сессиями, разрешениями, трассировкой и управлением инструментами.
23 апреля компания добавила встроенную память для Managed Agents - в виде файлов, которые разработчик может экспортировать, читать и изменять через API. Майское обновление надстраивается над этой памятью: агент периодически возвращается к накопленному опыту и обновляет память сам.
В подходе Anthropic виден сдвиг. Компания продвигает инфраструктурный слой для длительной агентной работы: память, контроль качества, распределение задач, уведомления, аудит действий. От «умного чат-бота» как самостоятельного продукта Anthropic уходит - её ставка ближе к корпоративному программному слою, чем к интерфейсу вопрос-ответ.
Где остаются открытые вопросы
Самые громкие цифры в анонсе - шестикратный рост завершения задач у Harvey и приросты outcomes во внутренних бенчмарках Anthropic. Они выглядят сильными, но завязаны на конкретные сценарии, настройки и методику измерения. В широком использовании результаты могут расходиться.
Есть и управленческий риск. Агент, который сам обновляет память, способен закреплять удачные практики, но точно так же может сохранить и ошибочные привычки. Поэтому ручной режим проверки изменений в Dreaming может оказаться важнее, чем читается по маркетинговому описанию.
Для разработчиков главный сигнал понятен: конкуренция в агентных платформах смещается с мощности модели к качеству обвязки вокруг неё. Если агент должен работать часами, ходить по инструментам и отвечать за результат, ему нужны память, проверяемые критерии успеха и журнал действий. Anthropic делает ставку именно на этот слой.


