LoRA-модель Qwen-Edit-2509-Multiple-angles научилась управлять виртуальной камерой в изображениях

ИИ научился смотреть под любым углом
Вчера на платформе Hugging Face появилось обновление модели Qwen-Edit-2509-Multiple-angles, основанной на Qwen-Image-Edit-2509 от Alibaba. Разработчик энтузиаст под ником dx8152 провёл дополнительное обучение, чтобы устранить нестабильность в согласованности изображений и улучшить качество редактирования при изменении углов съёмки.
Модель — это адаптация технологии LoRA (Low-Rank Adaptation), которая добавляет возможность контролировать положение и повороты виртуальной камеры без использования триггерных слов. Пользователь может «перемещать камеру» вперёд, назад, в стороны, наклонять её или переключать на широкий угол и крупный план. По сути, ИИ начинает мыслить не как редактор изображения, а как оператор камеры.
Новые возможности
Qwen-Edit-2509-Multiple-angles открывает перспективы для дизайнеров, видеомейкеров и разработчиков контента. Она позволяет создавать последовательные кадры с разных ракурсов. Например, вращение товара, обзор интерьера или плавный переход в анимации.
Разработчики отмечают, что после ноябрьского обновления улучшилась стабильность последовательных кадров, что особенно важно при создании коротких видео и рекламных клипов. Теперь движения камеры выглядят естественнее, а ИИ реже «теряет» форму или детали объектов.
Модель распространяется с открытой лицензией Apache 2.0 и поддерживается через библиотеку diffusers, облегчая интеграцию в приложения и интерфейсы вроде ComfyUI или Kling AI. Для установки достаточно загрузить файл с Hugging Face и добавить его в папку models/loras.
Почему это важно
Ранее подобные функции были доступны только в коммерческих решениях. Теперь открытое сообщество догоняет платные продукты, предлагая инструменты того же уровня для независимых художников и разработчиков. Видеодемонстрации, опубликованные пользователями, показали, как камера виртуально «облетает» объект, создавая иллюзию трёхмерного пространства.
Специалисты считают, что такие модели станут ключевыми для генерации динамического визуального контента — от рекламы до обучающих материалов. Особое внимание привлекает способность модели сохранять детали брендов и текстур, хотя мелкие артефакты, вроде искажённых надписей, пока ещё встречаются.
Перспективы развития
Qwen-Edit-2509-Multiple-angles — лишь часть более масштабного движения к «умному редактированию», где ИИ сам понимает контекст изображения. В будущем ожидаются обновления базовой версии Qwen-Image-Edit, способные обеспечить ещё большую точность и реализм.
Как отмечают эксперты, именно такие инициативы превращают генеративные модели из инструментов для экспериментов в профессиональные системы для креативных индустрий.


