Grok 3
Grok 3 был официально представлен 17 февраля 2025 года, а доступ начался 18 февраля 2025 года. Это флагман xAI на текущий момент, и его запуск сопровождался громкими заявлениями Илона Маска о том, что это «самый умный ИИ в мире».
Grok 3 тренировали на суперкомпьютере Colossus, который к тому времени расширили до 200 тысяч GPU Nvidia H100 (вдвое больше, чем было изначально). Маск утверждал, что модель потребовала в 10-15 раз больше вычислений, чем Grok 2, что делает её одной из самых ресурсоёмких моделей в мире.
Варианты
- Grok 3 Reasoning: Основная версия с акцентом на рассуждения. Она конкурирует с o3-mini от OpenAI и R1 от DeepSeek, умеет «думать» над задачами, проверять свои выводы и решать сложные вопросы в математике, науке и программировании. Есть режим «Big Brain», где используется дополнительная вычислительная мощность для особо трудных задач.
- Grok 3 mini Reasoning: Быстрая версия с меньшей точностью, но высокой скоростью отклика, для простых запросов.
Бенчмарки
xAI заявила, что Grok 3 обходит GPT-4o в ряде тестов:
- AIME 2025 (математика старшеклассников).
- GPQA (научные вопросы уровня PhD).
- Ранние версии также показали высокие результаты в Chatbot Arena, хотя споры с OpenAI о методе «cons@64» поставили эти данные под сомнение.
Новые функции
- : Инструмент, похожий на поискового агента. Он сканирует веб и посты на X, выдаёт краткие и подробные ответы с анализом данных. Это ответ xAI на инструменты вроде Deep Research от OpenAI.
- Генерация изображений: Неограниченная для подписчиков SuperGrok, улучшена по сравнению с Grok 2.
- Самокоррекция: Grok 3 якобы может проверять свои ответы на точность и исправлять ошибки в реальном времени, что уменьшает «галлюцинации» (вымышленные факты).
Доступ
- Сначала для подписчиков X Premium+ ($40/месяц) и SuperGrok ($30/месяц или $300/год).
- С 20 февраля 2025 года — бесплатно на X с лимитами по запросам.
- Обещают скоро выпустить API и добавить голосовой режим (чтение ответов вслух).
Значение
Grok 3 — это попытка xAI выйти в лидеры ИИ-индустрии. Маск и команда позиционируют её как модель, которая не только соревнуется с GPT-4o или o3 от OpenAI, но и превосходит их в рассуждениях и «правдоподобности». Использование огромных вычислительных ресурсов и интеграция с X дают ей уникальные преимущества, вроде анализа актуальных данных соцсети. Однако споры с OpenAI о методиках тестирования (например, «cons@64») и отсутствие полной прозрачности в данных вызывают вопросы. Реальная сила Grok 3 станет ясна только после независимых оценок, которые, скорее всего, появятся в ближайшие месяцы.