Google DeepMind открыла доступ к Project Genie - системе генерации интерактивных миров в реальном времени

Google DeepMind объявила о запуске Project Genie - исследовательского прототипа, который генерирует управляемые виртуальные пространства на основе текстовых и визуальных подсказок. В основе решения лежит модель Genie 3, продолжающая линейку предыдущих версий Genie 1 и Genie 2.
В отличие от традиционных генераторов изображений или видео, Project Genie формирует не просто картинку, а полноценную интерактивную среду. Пользователь описывает ландшафт - например, альпийский луг с деревянными хижинами или фантастическую планету с пылевыми бурями, а система создаёт трёхмерное пространство с возможностью перемещения и взаимодействия. Среда реагирует на действия: остаются следы на снегу, меняется освещение, объекты подчиняются физике.
Genie 3 способна формировать миры с разрешением до 720p в режиме реального времени. Разработчики подчёркивают, что модель демонстрирует устойчивость сцены и последовательность объектов при движении камеры, проблему, с которой ранее сталкивались многие генеративные системы. Фактически речь идёт о попытке построения так называемой «мировой модели» ИИ, который не просто создаёт изображение, а понимает структуру пространства и причинно-следственные связи внутри него.
Управление персонажами и редактирование среды
В сгенерированном мире можно выбрать персонажа и управлять им. Это может быть животное, транспорт или абстрактный объект - от собаки до картонной коробки с ногами. Доступны базовые действия: перемещение, прыжки, полёт, езда. По мере движения пространство достраивается динамически, и это создаёт эффект бесконечной сцены.
Перед запуском пользователь может уточнять параметры окружения, менять стилистику или перерабатывать уже созданный мир. Таким образом Project Genie сочетает генерацию, симуляцию и элементы игрового движка, но без необходимости программирования.
Ограниченный запуск и коммерческая модель
На текущем этапе сервис доступен подписчикам Google AI Ultra в США старше 18 лет. Это подчёркивает экспериментальный статус проекта. Компания пока не раскрывает точные сроки глобального расширения доступа, однако интерес к инструменту уже проявляют разработчики игр и специалисты по обучению автономных систем.
Важно, что продукт позиционируется не как развлекательная платформа, а как исследовательская среда. Google рассматривает Genie 3 как шаг к созданию более универсальных моделей, способных обучаться через симуляцию.
Значение для отрасли
Генерация интерактивных миров может существенно изменить подход к обучению ИИ-агентов. Вместо дорогостоящих физических экспериментов алгоритмы смогут отрабатывать сценарии в виртуальной среде с практически неограниченным количеством вариаций. Это особенно актуально для робототехники, автономного транспорта и сложных систем управления.
В игровой индустрии технология потенциально снижает порог входа: разработчик сможет создавать прототипы уровней без использования классических движков. Образовательные проекты также получают новый инструмент - например, возможность «погружения» в исторические эпохи или физические процессы.
Ранее в Google DeepMind отмечали, что развитие мировых моделей является одним из ключевых направлений на пути к более универсальному искусственному интеллекту. Project Genie демонстрирует практическую реализацию этой концепции.
Экспериментальный характер проекта означает, что система ещё далека от массового внедрения. Тем не менее сам факт появления работающего прототипа интерактивной генерации в реальном времени указывает на ускорение развития генеративных технологий.
Project Genie становится ещё одним подтверждением того, что конкуренция в области моделей нового поколения выходит за пределы текста и изображений - теперь борьба идёт за создание полноценных цифровых миров.



