Stability AI представила модель для генерации видео в реальном времени

Компания Stability AI анонсировала Stable Video Diffusion Turbo — новую модель для генерации видео, способную создавать ролики в режиме реального времени. Система генерирует видео со скоростью 20 кадров в секунду на потребительских GPU, что делает её первой по-настоящему доступной моделью для live-генерации видеоконтента. Модель может создавать клипы длительностью до 4 секунд с разрешением 512×512 пикселей, работая на видеокартах с 12 ГБ видеопамяти. Для сравнения, предыдущие версии требовали нескольких минут обработки на мощных серверах для создания аналогичного по длительности видео.

Технологический прорыв стал возможен благодаря применению метода дистилляции знаний и оптимизации архитектуры диффузионной модели. Разработчики сократили количество шагов денойзинга с 50 до 4, сохранив при этом приемлемое качество генерации. Модель обучалась на наборе данных из 600 миллионов видеоклипов и может работать как с текстовыми промптами, так и с исходным изображением в качестве первого кадра. Stability AI также выпустила API для интеграции технологии в сторонние приложения, что открывает возможности для создания интерактивных инструментов — от генерации анимации в графических редакторах до живых эффектов в приложениях для видеомонтажа. Компания позиционирует решение как альтернативу закрытым сервисам вроде Runway Gen-2, делая ставку на open-source подход и возможность локального запуска.

Появление генерации видео в реальном времени может фундаментально изменить рынок визуального контента, превращая видео из конечного продукта в интерактивную среду. Если текст и изображения уже стали «одноразовым» контентом, генерируемым по запросу, то видео оставалось медленным в производстве форматом. Теперь же открывается путь к персонализированным видеороликам, генерируемым индивидуально для каждого пользователя — от рекламы до образовательных материалов. Это также создаёт новые вызовы для детекции синтетического контента: когда генерация происходит за секунды, системы верификации должны работать ещё быстрее, чтобы предотвратить распространение дипфейков и дезинформации.