OpenAI представила o3-mini — новую модель ИИ с высокой точностью в науке и программировании

Новая модель OpenAI o3-mini разработана как компактное, но мощное решение для логических вычислений и технических задач. Она оптимизирована для работы со STEM-дисциплинами, включая математику, программирование и естественные науки.
OpenAI o3-mini поддерживает ключевые функции, востребованные разработчиками:
- Вызов функций (function calling)
- Структурированные выходные данные
- Поддержку потоковой передачи (streaming)
- Три уровня сложности рассуждений: низкий, средний и высокий
В отличие от OpenAI o1, новая модель не поддерживает обработку изображений, но превосходит своих предшественников в вычислительных задачах. Она доступна в API Chat Completions, Assistants API и Batch API для разработчиков 3-5 уровней, а также в ChatGPT Plus, Team и Pro.
Превосходство в математике, кодинге и логических задачах
OpenAI o3-mini значительно улучшила точность ответов на сложные технические вопросы. Согласно тестам:
- В математическом соревновании AIME 2024 (American Invitational Mathematics Examination) модель o3-mini в режиме высокой точности достигла 83,6% точности, что является лучшим результатом среди компактных моделей ИИ.
- В тесте GPQA, оценивающем способность ИИ отвечать на вопросы уровня PhD, o3-mini-high достигла 77% точности, демонстрируя значительное улучшение по сравнению с предыдущими моделями.
- В соревнованиях по программированию Codeforces модель o3-mini-high достигла 2073 Elo, что значительно превосходит показатели OpenAI o1-mini.
Кроме того, модель показала превосходные результаты в тестах SWE-bench Verified, оценивающих её навыки в программной инженерии. С высокой сложностью рассуждений она достигла 48,9% точности — лучший показатель среди моделей OpenAI данного класса.
Скорость и производительность
Одним из ключевых преимуществ OpenAI o3-mini стала высокая скорость работы. По сравнению с OpenAI o1-mini, она:
- Отвечает на 24% быстрее, со средней задержкой 7,7 секунды против 10,16 секунд
- Показывает на 39% меньше критических ошибок в сложных реальных задачах
- Улучшает точность и ясность ответов, что подтвердили независимые тестировщики, отдавшие предпочтение o3-mini в 56% случаев
Эти улучшения делают o3-mini идеальным выбором для специалистов, работающих с кодом, математическими расчетами и научными моделями, где важны точность и скорость.
Безопасность и устойчивость к взлому
Модель OpenAI o3-mini разрабатывалась с повышенным вниманием к безопасности. Она успешно противостоит попыткам обхода ограничений и показала высокие результаты в тестах по кибербезопасности, существенно превосходя GPT-4o в борьбе с jailbreak-атаками и небезопасным контентом.
Что дальше?
Запуск OpenAI o3-mini стал очередным шагом в стремлении компании сделать продвинутый ИИ доступнее. Новая модель снижает стоимость интеллектуальных вычислений и открывает возможности для разработчиков, нуждающихся в мощном, но недорогом решении. В будущем OpenAI планирует продолжать балансировать производительность, эффективность и безопасность, создавая новые модели для профессионалов и бизнеса.