OpenAI выпустила GPT-5.2: три модели для глубокого анализа, кодинга и долгоживущих агентов

OpenAI представила GPT-5.2 - новое поколение ИИ, ориентированное на сложные профессиональные задачи, долгие рабочие процессы и агентные сценарии. Модель усилила рассуждения, сократила ошибки и получила трёхуровневую линейку вариантов для задач разной сложности. GPT-5.2 уже доступна в ChatGPT и API и заменяет GPT-5.1 как основной рабочий инструмент.
OpenAI выпустила GPT-5.2: три модели для глубокого анализа, кодинга и долгоживущих агентов

OpenAI представила GPT-5.2 - флагманское обновление линейки, разработанное для тех, кому ИИ нужен не как помощник на один вопрос, а как полноценный рабочий инструмент. Модель уже интегрирована в платные планы ChatGPT, а в API стала доступна в виде семейства gpt-5.2, gpt-5.2-chat-latest и gpt-5.2-pro.

GPT-5.1 останется в интерфейсе только три месяца, после чего уступит место новому поколению.

Фокус на «knowledge work»

По информации OpenAI, GPT-5.2 значительно подняла планку качества в задачах, связанных с аналитикой, документами, кодом и планированием. На внутреннем бенчмарке GDPval, который оценивает практические задания из 44 профессий, модель в 70,9% случаев показывает результат не хуже или лучше индустриальных специалистов. Речь идёт о работе с таблицами, презентациями, регламентами, диаграммами и длинными документами.

Аналитики инвестиционных банков, помогавшие тестировать модель, отметили рост точности в сценариях вроде построения финансовых моделей или подготовки LBO - улучшение среднего балла составило почти 10 процентных пунктов по сравнению с GPT-5.1.

Прорыв в кодинге и длинном контексте

GPT-5.2 заметно усилила качество «агентного программирования», когда модель не просто дописывает фрагменты кода, а берёт на себя весь цикл: анализ репозитория, поиск ошибок, формирование патча и проверку результата. На SWE-Bench Verified модель достигла 80% успешных решений, улучшив показатели фронтенд-разработки и поиска багов.

Сильной стороной нового поколения стала работа с длинным контекстом: GPT-5.2 уверенно ориентируется в документах объёмом сотни тысяч токенов. На тесте MRCRv2 она почти безошибочно находит информацию в наборах больших текстов и диалогов, что особенно важно для юристов, исследователей и команд, работающих с массивами данных.

Для задач, превосходящих обычные лимиты контекста, в Responses API появился режим 

/compact, который компактно пересобирает историю и позволяет вести длинные рабочие цепочки с инструментальными вызовами - основа для сложных корпоративных агентов.

Три варианта модели

GPT-5.2 доступна в трёх версиях, каждая из которых ориентирована на свой сценарий:

  • GPT-5.2 Instant - быстрые ответы, техпис, обучение, повседневные диалоги.
  • GPT-5.2 Thinking - глубокие рассуждения, длинные документы, сложные задачи в логике, математике и программировании.
  • GPT-5.2 Pro - максимальная надёжность, минимум ошибок и самая высокая эффективность в науке, кодинге и работе с инструментами.

Pro-версия показала рекордные результаты на GPQA Diamond (93,2%), а Thinking стал лидером на задачах ARC-AGI, связанных с абстрактным мышлением.

Улучшения в Vision и точности

Сильные изменения затронули и визуальный модуль. GPT-5.2 лучше понимает графики, интерфейсы и технические схемы: количество ошибок при анализе диаграмм и GUI снизилось почти вдвое. Это отражается на задачах вроде интерпретации отчётов, скриншотов продуктов или инженерных схем.

Общая фактическая точность выросла существенно - частота ошибок уменьшилась примерно на треть относительно GPT-5.1. OpenAI уточняет, что критически важные выводы по-прежнему требуют человеческой проверки, но доверять повседневным материалам теперь заметно проще.

Производительность, цены и инфраструктура

Базовая версия GPT-5.2 в API стоит 1,75 доллара за миллион входных токенов (около 160 рублей) и 14 долларов за миллион выходных. С кешированными входами цена падает на 90%. Pro-вариант дороже, но рассчитан на аудиторию, где качество важнее бюджета.

Технически модель работает на инфраструктуре Microsoft Azure и NVIDIA - обучение и инференс распределены на кластерах с GPU H100, H200 и новыми GB200-NVL72.

Безопасность и фильтры

GPT-5.2 получила расширенную «карту безопасности». Модель стала корректнее отвечать на чувствительные запросы, включая темы эмоционального состояния и самоповреждения, и лучше фильтрует контент для пользователей младше 18 лет. При этом в сообществе обсуждаются случаи чрезмерной осторожности - иногда система перебивает творческие запросы чрезмерно жёстким шаблоном.

Первые отзывы: больше стабильности, но медленнее

Пользователи отмечают улучшения в аналитике, кодинге и работе с длинными проектами. Особенно хвалят стабильность при агентных задачах - от разбора больших репозиториев до подготовки развернутых исследований.

Одновременно часть отзывов указывает на снижение скорости в Thinking-режиме и отсутствие ощутимого рывка в творческих задачах, где модели Anthropic и Google порой воспринимаются гибче. Однако для структурированной, рабочей нагрузки GPT-5.2 уже называют самым надёжным инструментом OpenAI за последние годы.

GPT-5.2, по сути, формирует новый стандарт: это инструмент не для «пообщаться», а для тех, кто хочет делегировать ИИ значимую часть повседневной работы - от анализа данных до сложных инженерных задач.

22:40
589
OpenAI
OpenAI — это исследовательская компания в области искусственного интеллекта, основанная в декабре 2015 года. Целью компании является продвижение и разработка дружелюбного ИИ в интересах всего человечества.
Нет комментариев. Ваш будет первым!