Kling 3.0 вышел в релиз: ИИ-видеогенерация с фокусом на кинематограф и сторителлинг

Компания Kuaishou Technology и принадлежащая ей платформа Kling AI объявили о запуске линейки моделей Kling 3.0. Релиз состоялся в начале февраля и уже доступен в веб-интерфейсе сервиса для пользователей с подписками Pro, Premier и Ultra. По заявлению разработчиков, новая версия должна решить ключевую проблему ИИ-видео - отсутствие логики повествования и стабильности персонажей.
Kling 3.0 позиционируется не как инструмент для коротких клипов, а как система для создания связных видеосцен, рекламных роликов и визуальных историй с контролируемой структурой и звуком.
Что входит в линейку Kling 3.0
Новая версия включает сразу четыре модели, объединённые в единую экосистему:
- Video 3.0 - базовая модель для text-to-video и image-to-video генерации с длительностью роликов до 15 секунд.
- Video 3.0 Omni - расширенная версия с углублённым контролем сцен, ориентированная на сложные сценарии и сторибординг.
- Image 3.0 - модель для генерации изображений с акцентом на визуальное повествование и последовательность кадров.
- Image 3.0 Omni - профессиональная версия с нативным выводом в 4K и расширенными настройками композиции.
По словам команды Kling, архитектура 3.0 развивает решения, заложенные в версиях 2.6 и O1, и построена на мультимодальном фреймворке MVL, объединяющем текст, изображение, видео и звук в одном пайплайне.
Многокадровое видео и контроль структуры
Одно из ключевых нововведений - поддержка видеороликов длительностью до 15 секунд с разбиением на несколько шотов. Каждый шот можно настраивать отдельно: задавать собственный промпт, длительность и визуальные параметры. Такой подход приближает работу с моделью к монтажу, а не к генерации одиночного клипа.
Отдельно подчёркивается возможность задавать стартовые и финальные кадры, что позволяет сохранять целостность сцены и избегать резких визуальных разрывов.
Консистентность персонажей и референсы
Разработчики называют стабильность персонажей одной из главных задач, решённых в Kling 3.0. Модель лучше удерживает внешность героев от кадра к кадру, поддерживает изображения и видео в качестве референсов, а также привязку голоса к конкретному персонажу внутри проекта.
Это особенно важно для рекламных и нарративных видео, где «расползание» лиц и образов ранее было критическим ограничением ИИ-генераторов.
Нативное аудио и многоязычность
В отличие от предыдущих версий, Kling 3.0 генерирует звук одновременно с видео. Поддерживается синтез речи и фонового аудио на нескольких языках, с учётом акцентов и диалектов. Такой подход позволяет создавать не только немые ролики, но и полноценные диалоги с синхронизацией губ.
По заявлениям компании, дальнейшее развитие аудиомодуля связано с экосистемой O3, где планируется более тонкий контроль звукового дизайна.
Image 3.0 и переход к 4K
Модель Image 3.0 в Kling рассматривается как инструмент визуального сторителлинга, а не просто генератор изображений. Поддерживается нативный вывод в 2K и 4K, улучшена работа со светом, материалами и композицией кадра.
Разработчики также упоминают механизм Visual Chain-of-Thought - логическую цепочку, которая помогает сохранять атмосферу и стиль от изображения к изображению, что особенно важно при создании серийных сцен.
Доступность и партнёрские интеграции
На момент релиза Kling 3.0 доступен не всем пользователям. Ранний доступ получили подписчики старших тарифов, а также партнёрские платформы. Среди них упоминаются сервисы, интегрирующие Kling в собственные креативные пайплайны для дизайнеров и видеопродакшена.
Публичный доступ для широкой аудитории заявлен как следующий этап, сроки которого пока не раскрываются.
Контекст и значение релиза
Выход Kling 3.0 демонстрирует сдвиг всей индустрии ИИ-видео от коротких эффектных клипов к управляемым сценам и повествованию. Для Kuaishou это шаг к закреплению позиций на фоне конкуренции между крупными мультимодальными платформами, делающими ставку на длинное видео и продакшен-качество.
Для креаторов и студий Kling 3.0 может стать инструментом, который сокращает разрыв между экспериментальной ИИ-генерацией и реальными коммерческими задачами - от рекламы до игровых и медиапроектов.


