Cursor переработал агент для поддержки новой модели GPT-5.1-Codex-Max

​Команда Cursor обновила инфраструктуру своего агента, чтобы адаптировать его под работу с новой моделью OpenAI GPT-5.1-Codex-Max. Разработчики описали, какие изменения понадобились для стабильного взаимодействия, улучшения инструментальных вызовов и повышения качества автогенерации кода
Cursor переработал агент для поддержки новой модели GPT-5.1-Codex-Max

Cursor сообщил о масштабном обновлении своей агентной инфраструктуры - той части платформы, которая отвечает за работу моделей в режиме автономного помощника разработчика. Поводом стало появление нового поколения кодовых моделей OpenAIGPT-5.1-Codex-Max. Чтобы интеграция прошла гладко, пришлось внести глубокие изменения в сам «каркас» агента, а также пересмотреть стратегии вызова инструментов и обработки сообщений.

Cursor традиционно работает с моделями разных разработчиков, и для каждой создаётся свой набор инструкций, подсказок и доступных инструментов. По словам команды, новые модели Codex ориентированы на агентное программирование и требуют более тонкой настройки.

Переход к «shell-ориентированному» поведению

Codex CLI от OpenAI делает упор на использование оболочки: поиск, чтение файлов, внесение правок - всё чаще выполняется через shell-команды. Но для среды Cursor вызов внутренних инструментов остаётся более надёжным и безопасным.

Поэтому команда изменила названия инструментов, приблизив их к привычным shell-утилитам вроде rg (ripgrep). Это позволило модели быстрее понимать контекст и чаще выбирать инструментальные вызовы вместо выполнения Python-скриптов или прямых команд. Также в инструкциях появилось прямое указание:

«Если существует инструмент для действия, используй инструмент, а не shell-команду.»

Такой подход снижает риски и делает работу агента более предсказуемой.

Настройка преамбул и суммаризаций

В отличие от базовой линейки GPT-5, Codex-модели используют краткие reasoning summaries - небольшие фрагменты, в которых агент фиксирует ход своих рассуждений. Они помогают пользователю следить за прогрессом, но при чрезмерной детализации превращаются в шум.

Cursor ввёл ограничения: суммаризации должны быть короткими 1-2 предложения, только при смене тактики или появлении новой информации. Кроме того, разработчики удалили любую инструкцию, которая могла бы заставить модель «общаться с пользователем» до завершения шага - практика показала, что это заметно улучшает итоговый код.

Работа с линтерами: прямые указания вместо намёков

Хотя Cursor предоставляет инструмент для чтения ошибок линтера, Codex использовал его неохотно. Выяснилось, что одной декларации недостаточно - модели нужны чёткие формулировки, когда именно следует вызывать read_lints.

Формула получилась простой:

«После существенных правок используй read_lints, чтобы проверить файлы. Если есть ошибки, то исправь их.»

Такая прозрачность заметно повысила качество автогенерируемого кода.

Сохранение цепочек рассуждений критически важно

Одно из самых значимых наблюдений команды Cursor: Codex особенно чувствителен к потерям reasoning traces - внутренних цепочек мыслей, которые формируются между вызовами инструментов.

Если ссылка на предыдущие рассуждения теряется, агент начинает «угадывать» свои прошлые решения, что ломает планирование и приводит к ошибкам. В тестах Cursor Bench отсутствие reasoning traces снижало производительность Codex на 30%, а это очень много.

Для сравнения: у GPT-5 базовой серии эффект был всего 3%.

В результате команда добавила систему мониторинга и уведомлений: теперь потеря reasoning trace считается критическим событием.

Переориентация агента на активные действия

Разработчики отметили: иногда агент мог останавливаться и ждать подтверждения от пользователя, даже если задача подразумевала автоправки. Чтобы избежать этого, им добавили новые инструкции:

«Если пользователь не просит план или обсуждение, предполагается, что нужно сразу вносить изменения. Не описывай решение, а реализуй его. Если возникли сложности, попытайся решить их самостоятельно.»

В облачных Cloud Agents формулировки даже жёстче - максимальная автономность.

Важность порядка сообщений

Обучение моделей OpenAI построено так, что приоритет сообщений определяется их расположением: системные инструкции сильнее, чем пользовательские и это может быть опасно. Ранее Cursor давал модели советы вроде «бережно обращайся с токенами», и иногда модель интерпретировала их слишком буквально, отказываясь выполнять трудоёмкие действия.

Теперь инструкции переписаны так, чтобы не вступать в конфликт с пользовательскими запросами.

Чего ожидать в будущем

Команда Cursor подчёркивает: частота релизов новых моделей растёт, и каждое поколение приносит свои особенности. Компания обещает делиться материалами о том, как эволюционирует их агентная платформа, и какие практики позволяют адаптировать frontier-модели под реальные рабочие процессы разработчиков.

Такое внимание к инфраструктуре, это важный шаг к тому, чтобы «ИИ-программист» оставался предсказуемым и полезным, даже когда модели становятся всё более автономными.

08:40
795
Нет комментариев. Ваш будет первым!