OpenAI выпустила GPT-5.2: три модели для глубокого анализа, кодинга и долгоживущих агентов

OpenAI представила GPT-5.2 - флагманское обновление линейки, разработанное для тех, кому ИИ нужен не как помощник на один вопрос, а как полноценный рабочий инструмент. Модель уже интегрирована в платные планы ChatGPT, а в API стала доступна в виде семейства gpt-5.2, gpt-5.2-chat-latest и gpt-5.2-pro.
GPT-5.1 останется в интерфейсе только три месяца, после чего уступит место новому поколению.
Фокус на «knowledge work»
По информации OpenAI, GPT-5.2 значительно подняла планку качества в задачах, связанных с аналитикой, документами, кодом и планированием. На внутреннем бенчмарке GDPval, который оценивает практические задания из 44 профессий, модель в 70,9% случаев показывает результат не хуже или лучше индустриальных специалистов. Речь идёт о работе с таблицами, презентациями, регламентами, диаграммами и длинными документами.
Аналитики инвестиционных банков, помогавшие тестировать модель, отметили рост точности в сценариях вроде построения финансовых моделей или подготовки LBO - улучшение среднего балла составило почти 10 процентных пунктов по сравнению с GPT-5.1.
Прорыв в кодинге и длинном контексте
GPT-5.2 заметно усилила качество «агентного программирования», когда модель не просто дописывает фрагменты кода, а берёт на себя весь цикл: анализ репозитория, поиск ошибок, формирование патча и проверку результата. На SWE-Bench Verified модель достигла 80% успешных решений, улучшив показатели фронтенд-разработки и поиска багов.
Сильной стороной нового поколения стала работа с длинным контекстом: GPT-5.2 уверенно ориентируется в документах объёмом сотни тысяч токенов. На тесте MRCRv2 она почти безошибочно находит информацию в наборах больших текстов и диалогов, что особенно важно для юристов, исследователей и команд, работающих с массивами данных.
Для задач, превосходящих обычные лимиты контекста, в Responses API появился режим
/compact, который компактно пересобирает историю и позволяет вести длинные рабочие цепочки с инструментальными вызовами - основа для сложных корпоративных агентов.
Три варианта модели
GPT-5.2 доступна в трёх версиях, каждая из которых ориентирована на свой сценарий:
- GPT-5.2 Instant - быстрые ответы, техпис, обучение, повседневные диалоги.
- GPT-5.2 Thinking - глубокие рассуждения, длинные документы, сложные задачи в логике, математике и программировании.
- GPT-5.2 Pro - максимальная надёжность, минимум ошибок и самая высокая эффективность в науке, кодинге и работе с инструментами.
Pro-версия показала рекордные результаты на GPQA Diamond (93,2%), а Thinking стал лидером на задачах ARC-AGI, связанных с абстрактным мышлением.
Улучшения в Vision и точности
Сильные изменения затронули и визуальный модуль. GPT-5.2 лучше понимает графики, интерфейсы и технические схемы: количество ошибок при анализе диаграмм и GUI снизилось почти вдвое. Это отражается на задачах вроде интерпретации отчётов, скриншотов продуктов или инженерных схем.
Общая фактическая точность выросла существенно - частота ошибок уменьшилась примерно на треть относительно GPT-5.1. OpenAI уточняет, что критически важные выводы по-прежнему требуют человеческой проверки, но доверять повседневным материалам теперь заметно проще.
Производительность, цены и инфраструктура
Базовая версия GPT-5.2 в API стоит 1,75 доллара за миллион входных токенов (около 160 рублей) и 14 долларов за миллион выходных. С кешированными входами цена падает на 90%. Pro-вариант дороже, но рассчитан на аудиторию, где качество важнее бюджета.
Технически модель работает на инфраструктуре Microsoft Azure и NVIDIA - обучение и инференс распределены на кластерах с GPU H100, H200 и новыми GB200-NVL72.
Безопасность и фильтры
GPT-5.2 получила расширенную «карту безопасности». Модель стала корректнее отвечать на чувствительные запросы, включая темы эмоционального состояния и самоповреждения, и лучше фильтрует контент для пользователей младше 18 лет. При этом в сообществе обсуждаются случаи чрезмерной осторожности - иногда система перебивает творческие запросы чрезмерно жёстким шаблоном.
Первые отзывы: больше стабильности, но медленнее
Пользователи отмечают улучшения в аналитике, кодинге и работе с длинными проектами. Особенно хвалят стабильность при агентных задачах - от разбора больших репозиториев до подготовки развернутых исследований.
Одновременно часть отзывов указывает на снижение скорости в Thinking-режиме и отсутствие ощутимого рывка в творческих задачах, где модели Anthropic и Google порой воспринимаются гибче. Однако для структурированной, рабочей нагрузки GPT-5.2 уже называют самым надёжным инструментом OpenAI за последние годы.
GPT-5.2, по сути, формирует новый стандарт: это инструмент не для «пообщаться», а для тех, кто хочет делегировать ИИ значимую часть повседневной работы - от анализа данных до сложных инженерных задач.



