LoRA-модель Qwen-Edit-2509-Multiple-angles научилась управлять виртуальной камерой в изображениях

Hugging Face представила обновлённую LoRA-модель Qwen-Edit-2509-Multiple-angles, разработанную энтузиастом под ником dx8152. Это обновление делает редактирование изображений с управлением камерой точнее и стабильнее - теперь ИИ способен буквально «двигаться вокруг объекта» без потери качества.
LoRA-модель Qwen-Edit-2509-Multiple-angles научилась управлять виртуальной камерой в изображениях

ИИ научился смотреть под любым углом

Вчера на платформе Hugging Face появилось обновление модели Qwen-Edit-2509-Multiple-angles, основанной на Qwen-Image-Edit-2509 от Alibaba. Разработчик энтузиаст под ником dx8152 провёл дополнительное обучение, чтобы устранить нестабильность в согласованности изображений и улучшить качество редактирования при изменении углов съёмки.

Модель — это адаптация технологии LoRA (Low-Rank Adaptation), которая добавляет возможность контролировать положение и повороты виртуальной камеры без использования триггерных слов. Пользователь может «перемещать камеру» вперёд, назад, в стороны, наклонять её или переключать на широкий угол и крупный план. По сути, ИИ начинает мыслить не как редактор изображения, а как оператор камеры.

Новые возможности

Qwen-Edit-2509-Multiple-angles открывает перспективы для дизайнеров, видеомейкеров и разработчиков контента. Она позволяет создавать последовательные кадры с разных ракурсов. Например, вращение товара, обзор интерьера или плавный переход в анимации.

Разработчики отмечают, что после ноябрьского обновления улучшилась стабильность последовательных кадров, что особенно важно при создании коротких видео и рекламных клипов. Теперь движения камеры выглядят естественнее, а ИИ реже «теряет» форму или детали объектов.

Модель распространяется с открытой лицензией Apache 2.0 и поддерживается через библиотеку diffusers, облегчая интеграцию в приложения и интерфейсы вроде ComfyUI или Kling AI. Для установки достаточно загрузить файл с Hugging Face и добавить его в папку models/loras.

Почему это важно

Ранее подобные функции были доступны только в коммерческих решениях. Теперь открытое сообщество догоняет платные продукты, предлагая инструменты того же уровня для независимых художников и разработчиков. Видеодемонстрации, опубликованные пользователями, показали, как камера виртуально «облетает» объект, создавая иллюзию трёхмерного пространства.

Специалисты считают, что такие модели станут ключевыми для генерации динамического визуального контента — от рекламы до обучающих материалов. Особое внимание привлекает способность модели сохранять детали брендов и текстур, хотя мелкие артефакты, вроде искажённых надписей, пока ещё встречаются.

Перспективы развития

Qwen-Edit-2509-Multiple-angles — лишь часть более масштабного движения к «умному редактированию», где ИИ сам понимает контекст изображения. В будущем ожидаются обновления базовой версии Qwen-Image-Edit, способные обеспечить ещё большую точность и реализм.

Как отмечают эксперты, именно такие инициативы превращают генеративные модели из инструментов для экспериментов в профессиональные системы для креативных индустрий.

09:50
334
Нет комментариев. Ваш будет первым!