Codex от OpenAI: новый ИИ-помощник для программистов уже в ChatGPT

OpenAI представила Codex — нового облачного агента программирования, способного выполнять задачи от написания кода до проведения тестов в изолированной среде. Codex уже доступен в ChatGPT для профессиональных пользователей, открывая перспективы нового подхода к разработке ПО с участием ИИ.
Codex от OpenAI: новый ИИ-помощник для программистов уже в ChatGPT

OpenAI запустила в тестовом режиме Codex — облачного программного агента, способного самостоятельно выполнять широкий спектр инженерных задач. Codex интегрирован в ChatGPT и уже доступен пользователям с подписками Pro, Team и Enterprise. Инструмент предназначен для автоматизации таких задач, как генерация и исправление кода, написание тестов и предложение изменений в репозиториях. В дальнейшем доступ будет расширен и на подписчиков Plus и Edu.

Что умеет Codex

Codex работает через боковую панель в ChatGPT. Пользователь может задать кодовую задачу, нажав кнопку «Code», или задать вопрос о коде через «Ask». Каждая задача обрабатывается в отдельной облачной среде, уже предзагруженной содержимым вашего GitHub-репозитория. 

Агент способен:

  • писать новые функции и исправлять баги;
  • редактировать файлы, запускать тесты, линтеры и анализаторы типов;
  • оформлять pull request или подготовить изменения для локальной интеграции.

Результаты выполнения сопровождаются логами и тестовыми выводами, что позволяет пользователю отследить каждое действие. Инструмент поддерживает конфигурацию под реальную среду разработки, включая возможность подстроить поведение агента с помощью специального файла AGENTS.md — своего рода инструкции для ИИ-разработчика.

Архитектура и обучение модели

В основе Codex лежит модель codex-1 — специализированная версия архитектуры OpenAI o3, дообученная методом подкрепления на реальных инженерных задачах. Она создаёт чистые и читаемые патчи, следуя стилю и логике, присущим профессиональным разработчикам. Codex обучен действовать аккуратно и итеративно, добиваясь прохождения тестов и соблюдения принятых стандартов проекта.

Производительность и бенчмарки

Codex-1 демонстрирует высокие результаты на внутренних инженерных задачах OpenAI и бенчмарке SWE-Bench Verified — стандартизированном наборе задач по реальному программному обеспечению. Даже при отсутствии конфигурационных файлов AGENTS.md агент показывает уверенные результаты, следуя стилю кода и стандартам, принятым в индустрии.

Модель тестировалась при контексте до 192 тысяч токенов и средней нагрузке на логическое мышление (reasoning effort), что соответствует режиму использования в продукте.

В рамках тестов были исключены 23 задачи SWE-Bench, которые не запускались в инфраструктуре. Это подчёркивает стремление OpenAI к объективной оценке и прозрачности результатов.

SWE-Bench Verified

Безопасность и этика

Codex выполняет все задачи в изолированной среде без доступа к интернету. Он взаимодействует только с загруженными пользователем данными и заданными зависимостями. Модель настроена на отказ от выполнения вредоносных или потенциально опасных задач, включая разработку вредоносного ПО, но при этом поддерживает легитимную низкоуровневую инженерную работу.

«Codex объясняет свои действия и сообщает о сбоях, чтобы пользователь мог принимать обоснованные решения», — отмечают в OpenAI.

Первая волна применения

Технические команды OpenAI уже используют Codex в повседневной работе — от рефакторинга до обработки инцидентов и планирования задач. В числе внешних тестировщиков:

  • Cisco — изучает применение Codex для ускорения реализации новых идей.
  • Temporal — использует агента для разработки, тестирования и отладки.
  • Superhuman — ускоряет выполнение рутинных задач и уменьшает нагрузку на инженеров.
  • Kodiak Robotics — применяет Codex для поддержки автономного вождения, улучшения тестов и рефакторинга.

Codex CLI и mini-модель

Помимо облачной версии, Codex доступен и как локальный агент Codex CLI с открытым исходным кодом. Новая версия модели codex-mini-latest, основанная на архитектуре o4-mini, обеспечивает быструю работу в терминале и доступна через API. Стоимость — $1.50 за миллион входных токенов и $6 за миллион выходных, с учётом 75% скидки при повторном использовании подсказок.

Также упростилась авторизация: теперь достаточно войти через аккаунт ChatGPT, чтобы получить API-ключ и бонусные кредиты — 5 или 50 долларов для пользователей Plus и Pro соответственно.

Что дальше

OpenAI продолжит развивать Codex, расширяя поддержку интерактивного взаимодействия: в будущем пользователи смогут изменять задачи по ходу выполнения, получать отчёты о ходе работы и делегировать задачи через CI-системы или трекеры задач.

«Мы представляем будущее, где разработчики фокусируются на важном, а рутинные задачи отдают агентам», — заявляют в компании.

Codex уже стал частью новой реальности для программистов — теперь его задача не просто помочь, а стать полноценным участником инженерного процесса.

Ниже представлено применение Codex CLI от OpenAI в видео от 16 апреля 

05:00
219
OpenAI
OpenAI — это исследовательская компания в области искусственного интеллекта, основанная в декабре 2015 года. Целью компании является продвижение и разработка дружелюбного ИИ в интересах всего человечества.
Нет комментариев. Ваш будет первым!
Яндекс.Метрика