Cursor переработал агент для поддержки новой модели GPT-5.1-Codex-Max

Cursor сообщил о масштабном обновлении своей агентной инфраструктуры - той части платформы, которая отвечает за работу моделей в режиме автономного помощника разработчика. Поводом стало появление нового поколения кодовых моделей OpenAI — GPT-5.1-Codex-Max. Чтобы интеграция прошла гладко, пришлось внести глубокие изменения в сам «каркас» агента, а также пересмотреть стратегии вызова инструментов и обработки сообщений.
Cursor традиционно работает с моделями разных разработчиков, и для каждой создаётся свой набор инструкций, подсказок и доступных инструментов. По словам команды, новые модели Codex ориентированы на агентное программирование и требуют более тонкой настройки.
Переход к «shell-ориентированному» поведению
Codex CLI от OpenAI делает упор на использование оболочки: поиск, чтение файлов, внесение правок - всё чаще выполняется через shell-команды. Но для среды Cursor вызов внутренних инструментов остаётся более надёжным и безопасным.
Поэтому команда изменила названия инструментов, приблизив их к привычным shell-утилитам вроде rg (ripgrep). Это позволило модели быстрее понимать контекст и чаще выбирать инструментальные вызовы вместо выполнения Python-скриптов или прямых команд. Также в инструкциях появилось прямое указание:
«Если существует инструмент для действия, используй инструмент, а не shell-команду.»
Такой подход снижает риски и делает работу агента более предсказуемой.
Настройка преамбул и суммаризаций
В отличие от базовой линейки GPT-5, Codex-модели используют краткие reasoning summaries - небольшие фрагменты, в которых агент фиксирует ход своих рассуждений. Они помогают пользователю следить за прогрессом, но при чрезмерной детализации превращаются в шум.
Cursor ввёл ограничения: суммаризации должны быть короткими 1-2 предложения, только при смене тактики или появлении новой информации. Кроме того, разработчики удалили любую инструкцию, которая могла бы заставить модель «общаться с пользователем» до завершения шага - практика показала, что это заметно улучшает итоговый код.
Работа с линтерами: прямые указания вместо намёков
Хотя Cursor предоставляет инструмент для чтения ошибок линтера, Codex использовал его неохотно. Выяснилось, что одной декларации недостаточно - модели нужны чёткие формулировки, когда именно следует вызывать read_lints.
Формула получилась простой:
«После существенных правок используй read_lints, чтобы проверить файлы. Если есть ошибки, то исправь их.»
Такая прозрачность заметно повысила качество автогенерируемого кода.
Сохранение цепочек рассуждений критически важно
Одно из самых значимых наблюдений команды Cursor: Codex особенно чувствителен к потерям reasoning traces - внутренних цепочек мыслей, которые формируются между вызовами инструментов.
Если ссылка на предыдущие рассуждения теряется, агент начинает «угадывать» свои прошлые решения, что ломает планирование и приводит к ошибкам. В тестах Cursor Bench отсутствие reasoning traces снижало производительность Codex на 30%, а это очень много.
Для сравнения: у GPT-5 базовой серии эффект был всего 3%.
В результате команда добавила систему мониторинга и уведомлений: теперь потеря reasoning trace считается критическим событием.
Переориентация агента на активные действия
Разработчики отметили: иногда агент мог останавливаться и ждать подтверждения от пользователя, даже если задача подразумевала автоправки. Чтобы избежать этого, им добавили новые инструкции:
«Если пользователь не просит план или обсуждение, предполагается, что нужно сразу вносить изменения. Не описывай решение, а реализуй его. Если возникли сложности, попытайся решить их самостоятельно.»
В облачных Cloud Agents формулировки даже жёстче - максимальная автономность.
Важность порядка сообщений
Обучение моделей OpenAI построено так, что приоритет сообщений определяется их расположением: системные инструкции сильнее, чем пользовательские и это может быть опасно. Ранее Cursor давал модели советы вроде «бережно обращайся с токенами», и иногда модель интерпретировала их слишком буквально, отказываясь выполнять трудоёмкие действия.
Теперь инструкции переписаны так, чтобы не вступать в конфликт с пользовательскими запросами.
Чего ожидать в будущем
Команда Cursor подчёркивает: частота релизов новых моделей растёт, и каждое поколение приносит свои особенности. Компания обещает делиться материалами о том, как эволюционирует их агентная платформа, и какие практики позволяют адаптировать frontier-модели под реальные рабочие процессы разработчиков.
Такое внимание к инфраструктуре, это важный шаг к тому, чтобы «ИИ-программист» оставался предсказуемым и полезным, даже когда модели становятся всё более автономными.


