GPT-4o mini: OpenAI представляет экономичную модель ИИ с впечатляющей производительностью
OpenAI, ведущая компания в области искусственного интеллекта, анонсировала выпуск GPT-4o mini - своей самой экономичной малой модели. Эта новая разработка призвана значительно расширить спектр приложений, использующих ИИ, сделав интеллектуальные технологии гораздо более доступными.
Ключевые характеристики GPT-4o mini
- Производительность: GPT-4o mini демонстрирует впечатляющие результаты, набирая 82% в тесте MMLU (Massive Multitask Language Understanding) и превосходя GPT-4 по предпочтениям пользователей в чатах согласно рейтингу LMSYS.
- Экономичность: Стоимость использования модели составляет 15 центов за миллион входных токенов и 60 центов за миллион выходных токенов. Это на порядок дешевле предыдущих передовых моделей и более чем на 60% дешевле GPT-3.5 Turbo.
- Возможности: Модель поддерживает обработку текста и изображений через API, с планами на поддержку видео и аудио в будущем. GPT-4o mini имеет контекстное окно в 128 тысяч токенов и поддерживает до 16 тысяч выходных токенов на запрос.
- Актуальность: База знаний модели обновлена до октября 2023 года.
Преимущества и применение
GPT-4o mini особенно эффективна для задач, требующих низкой стоимости и малой задержки:
- Приложения, выполняющие множественные или параллельные вызовы модели
- Обработка большого объема контекстной информации (например, полной кодовой базы или истории разговора)
- Взаимодействие с клиентами через быстрые текстовые ответы в реальном времени (чат-боты поддержки)
Сравнительная производительность
GPT-4o mini превосходит GPT-3.5 Turbo и другие малые модели по ряду академических тестов:
- MMLU (текстовый интеллект и рассуждения): 82.0% против 77.9% у Gemini Flash и 73.8% у Claude Haiku
- MGSM (математические рассуждения): 87.0% против 75.5% у Gemini Flash и 71.7% у Claude Haiku
- HumanEval (программирование): 87.2% против 71.5% у Gemini Flash и 75.9% у Claude Haiku
- MMMU (мультимодальные рассуждения): 59.4% против 56.1% у Gemini Flash и 50.2% у Claude Haiku
Безопасность и надежность
OpenAI уделяет особое внимание безопасности своих моделей:
- Фильтрация нежелательного контента на этапе обучения
- Применение техник обучения с подкреплением на основе обратной связи от людей (RLHF)
- Использование новой методики "иерархии инструкций" для повышения устойчивости к попыткам обхода ограничений и извлечения системных промптов
Доступность и цены
GPT-4o mini доступна через API для работы с текстом и изображениями. Стоимость составляет 15 центов за миллион входных токенов и 60 центов за миллион выходных токенов.
Модель также будет доступна пользователям ChatGPT (бесплатным, Plus и Team) вместо GPT-3.5, а для корпоративных пользователей - со следующей недели.
Перспективы
OpenAI продолжает работу над снижением стоимости и повышением возможностей своих моделей. За последние годы стоимость обработки токена снизилась на 99% по сравнению с моделью text-davinci-003, представленной в 2022 году.
Компания видит будущее, где модели ИИ будут интегрированы в каждое приложение и веб-сайт. GPT-4o mini - важный шаг на пути к более доступному, надежному и повсеместному искусственному интеллекту.