Qwen3-Max-Thinking - нейросеть, которая научилась думать, а не просто отвечать

Alibaba представила экспериментальную версию Qwen3-Max-Thinking - нейросеть, способную рассуждать шаг за шагом, использовать инструменты и буквально «думать» над задачей, прежде чем ответить. Новый режим уже называют крупнейшим скачком в развитии ИИ-логики с начала десятилетия.
Qwen3-Max-Thinking - нейросеть, которая научилась думать, а не просто отвечать

Лаборатория Tongyi при Alibaba открыла ранний доступ к модели Qwen3-Max-Thinking — экспериментальной версии флагманского Qwen3-Max. Этот вариант сконцентрирован не на скорости генерации текста, а на способности пошагово рассуждать и решать задачи, требующие логики и анализа.

Разработчики называют это «режимом мышления». В нём модель может не сразу выдавать ответ, а использовать внутренний «бюджет рассуждений» до 82 тысяч токенов. За это время она проверяет гипотезы, пишет и исполняет код, сравнивает решения и выбирает наиболее точное.

Попробовать новый режим можно уже сейчас в веб-чате Qwen Chat или через облачный API Alibaba Cloud, просто включив параметр enable_thinking=True.

Как она работает

Модель построена на архитектуре Mixture of Experts (MoE) и насчитывает более триллиона параметров. Она обучена на 36 триллионах токенов, включая материалы по программированию, естественным наукам и точным дисциплинам.

Режим Thinking добавляет надстройку — систему, которая параллельно запускает несколько версий вычислений и отбирает наиболее корректную. По сути, это шаг к моделям, способным не только вспоминать знания, но и рассуждать, как человек.

Особенность Qwen3-Max-Thinking — обработка контекста до 1 миллиона токенов, что позволяет анализировать огромные тексты, коды или базы данных целиком.
В инфраструктуре Alibaba используется собственная технология ChunkFlow, повышающая скорость работы с длинными документами почти втрое по сравнению с традиционными подходами.

Производительность и первые результаты

На профильных тестах, вроде AIME 2025 (математическая олимпиада для старшеклассников США) и HMMT (турнир Гарвард–MIT), модель достигла 100 % правильных решений, используя встроенные инструменты вычислений.

В реальных задачах программирования — например, на тесте SWE-Bench Verified, где модели исправляют ошибки в открытом коде, — Qwen3-Max-Thinking показала точность 69,6 балла, что сопоставимо с лучшими мировыми результатами.

Но, как отмечают ранние тестировщики, у модели есть и слабые стороны: она может быть излишне многословной и не всегда идеально справляется с задачами на креативность или интерфейсный код. Впрочем, для «чернового» этапа развития это ожидаемо.

Значимость для разработчиков

Qwen3-Max-Thinking полностью совместима с API OpenAI, что упрощает её интеграцию в существующие проекты. Для подключения достаточно зарегистрироваться в Model Studio Alibaba Cloud и создать ключ доступа.

Таким образом, любой разработчик может протестировать «мыслящий режим» без сложной настройки и инфраструктуры.

Перспективы

Для китайского ИИ-рынка запуск Thinking-версии — стратегический шаг. Alibaba делает ставку на открытую экосистему: Qwen-модели традиционно публикуются с открытым кодом или совместимыми API.

Эксперты считают, что Qwen3-Max-Thinking может стать важным инструментом для автоматизации научных исследований, образования и аналитики, где от ИИ требуется не просто ответ, а логика и доказательство.

«Мы приближаемся к моменту, когда нейросети перестанут имитировать мышление — они начнут действительно рассуждать», 

— написал один из участников теста на платформе X.

В контексте

Серия Qwen развивается с 2023 года: от базовой открытой версии до современных моделей с многомодульной архитектурой и параллельными вычислениями.

Qwen3-Max-Thinking — промежуточный, но знаковый шаг на пути к созданию систем, где ИИ сможет действовать как автономный агент: анализировать, планировать и принимать решения, а не просто подбирать ответы.

18:15
219
Нет комментариев. Ваш будет первым!