Tencent представила HunyuanWorld 1.0 — открытую модель для создания интерактивных 3D-миров

Hunyuan3D World Model 1.0 — так называется новая разработка команды Tencent Hunyuan, представленная 26 июля 2025 года. Это одна из первых моделей, которая позволяет создать целый виртуальный мир буквально по фразе вроде «японский сад на закате». Причём речь не о картинке, а об интерактивной сцене — с деревьями, прудом, тенями и всем прочим, что можно использовать в игровом движке или VR-приложении.
Модель доступна для загрузки на популярных платформах вроде GitHub и Hugging Face, а также протестировать её можно прямо через онлайн-демо.
Что умеет Hunyuan3D?
Созданный мир можно не только посмотреть, но и «пощупать» — перемещать объекты, редактировать сцены, масштабировать. Вдобавок модель хорошо интегрируется с такими инструментами, как Blender, Unity и Unreal Engine, что делает её крайне удобной для разработчиков.
Особенность Hunyuan3D — она не просто строит сцену, а разбивает её на слои (небо, объекты, фон), а также создаёт панорамный «прокси»-мир на 360°, отталкиваясь от текста или изображения. В результате — настоящая «песочница» для 3D-дизайна и моделирования.
Пример: вы вводите «Japanese garden at sunset», и получаете готовую сцену с прудом, деревьями и мягким освещением — как будто вы уже внутри виртуального пространства.
Результаты и тесты
Hunyuan3D была протестирована по сравнению с рядом аналогов — Diffusion360, MVDiffusion, LayerPano3D и другими. Во всех основных задачах (текст-в-панораму, изображение-в-панораму, текст-в-мир, изображение-в-мир) она показала лучшие метрики по качеству изображения (BRISQUE, NIQE) и соответствию исходному запросу (CLIP-T, Q-Align).
Например, в задаче «текст в панораму» HunyuanWorld 1.0 получила BRISQUE — 40,8, NIQE — 5,8, что существенно лучше ближайших конкурентов. То же касается и других направлений — модель стабильно держится в лидерах.
Техническая основа
Архитектура Hunyuan3D включает:
- Панорамную генерацию (360°) как основу сцены.
- Семантическое разделение элементов (небо, фон, объекты).
- Иерархическую реконструкцию с постепенным наращиванием деталей.
Также поддерживается загрузка как текстов, так и изображений в качестве входных данных — это даёт больше гибкости для разных сценариев.
Модель выпускается в нескольких вариантах:
- PanoDiT для генерации панорам по тексту или изображению,
- PanoInpaint для доработки сцен — отдельно фона и неба.
Для кого это?
- Разработчики игр могут быстрее создавать уровни и локации.
- Создатели VR-контента — мгновенно проектировать окружение.
- Архитекторы и дизайнеры — моделировать пространства.
- Образовательные платформы — создавать визуальные симуляции.
А учитывая, что модель открытая — её можно не только использовать, но и адаптировать под свои задачи.
Реакция сообщества
На Reddit и других форумах модель вызвала оживлённое обсуждение. Кто-то уже экспериментирует с генерацией нестандартных сцен, кто-то делится критикой геометрии на мелких объектах. Но общее настроение — заинтересованное и оптимистичное.
«Это может полностью изменить то, как мы подходим к разработке 3D-контента. Особенно в инди-геймдеве», — отмечает один из пользователей Reddit.
Вывод
Hunyuan3D World Model 1.0 — это не просто очередная генеративная модель, а шаг в сторону настоящей интерактивной визуализации «из ничего». Она уже сейчас предлагает то, что ещё недавно казалось экспериментом из лаборатории: взять идею — и за минуту превратить её в виртуальное пространство.
Да, остаются вопросы к детализации, да, предстоит работа по доработке. Но сам факт — технология, с которой стоит познакомиться поближе, особенно тем, кто работает в 3D, играх или VR.


