Qwen3-Max-Thinking - нейросеть, которая научилась думать, а не просто отвечать

Лаборатория Tongyi при Alibaba открыла ранний доступ к модели Qwen3-Max-Thinking — экспериментальной версии флагманского Qwen3-Max. Этот вариант сконцентрирован не на скорости генерации текста, а на способности пошагово рассуждать и решать задачи, требующие логики и анализа.
Разработчики называют это «режимом мышления». В нём модель может не сразу выдавать ответ, а использовать внутренний «бюджет рассуждений» до 82 тысяч токенов. За это время она проверяет гипотезы, пишет и исполняет код, сравнивает решения и выбирает наиболее точное.
Попробовать новый режим можно уже сейчас в веб-чате Qwen Chat или через облачный API Alibaba Cloud, просто включив параметр enable_thinking=True.
Как она работает
Модель построена на архитектуре Mixture of Experts (MoE) и насчитывает более триллиона параметров. Она обучена на 36 триллионах токенов, включая материалы по программированию, естественным наукам и точным дисциплинам.
Режим Thinking добавляет надстройку — систему, которая параллельно запускает несколько версий вычислений и отбирает наиболее корректную. По сути, это шаг к моделям, способным не только вспоминать знания, но и рассуждать, как человек.
Особенность Qwen3-Max-Thinking — обработка контекста до 1 миллиона токенов, что позволяет анализировать огромные тексты, коды или базы данных целиком.
В инфраструктуре Alibaba используется собственная технология ChunkFlow, повышающая скорость работы с длинными документами почти втрое по сравнению с традиционными подходами.
Производительность и первые результаты
На профильных тестах, вроде AIME 2025 (математическая олимпиада для старшеклассников США) и HMMT (турнир Гарвард–MIT), модель достигла 100 % правильных решений, используя встроенные инструменты вычислений.
В реальных задачах программирования — например, на тесте SWE-Bench Verified, где модели исправляют ошибки в открытом коде, — Qwen3-Max-Thinking показала точность 69,6 балла, что сопоставимо с лучшими мировыми результатами.
Но, как отмечают ранние тестировщики, у модели есть и слабые стороны: она может быть излишне многословной и не всегда идеально справляется с задачами на креативность или интерфейсный код. Впрочем, для «чернового» этапа развития это ожидаемо.
Значимость для разработчиков
Qwen3-Max-Thinking полностью совместима с API OpenAI, что упрощает её интеграцию в существующие проекты. Для подключения достаточно зарегистрироваться в Model Studio Alibaba Cloud и создать ключ доступа.
Таким образом, любой разработчик может протестировать «мыслящий режим» без сложной настройки и инфраструктуры.
Перспективы
Для китайского ИИ-рынка запуск Thinking-версии — стратегический шаг. Alibaba делает ставку на открытую экосистему: Qwen-модели традиционно публикуются с открытым кодом или совместимыми API.
Эксперты считают, что Qwen3-Max-Thinking может стать важным инструментом для автоматизации научных исследований, образования и аналитики, где от ИИ требуется не просто ответ, а логика и доказательство.
«Мы приближаемся к моменту, когда нейросети перестанут имитировать мышление — они начнут действительно рассуждать»,
— написал один из участников теста на платформе X.
В контексте
Серия Qwen развивается с 2023 года: от базовой открытой версии до современных моделей с многомодульной архитектурой и параллельными вычислениями.
Qwen3-Max-Thinking — промежуточный, но знаковый шаг на пути к созданию систем, где ИИ сможет действовать как автономный агент: анализировать, планировать и принимать решения, а не просто подбирать ответы.


