11 апреля 2025

eur = 94.60 -0.49 (-0.51 %)

btc = 82 611.00$ 1 619.27 (2.00 %)

eth = 1 564.33$ -4.10 (-0.26 %)

ton = 2.94$ -0.02 (-0.53 %)

usd = 85.02 -1.08 (-1.25 %)

eur = 94.60 -0.49 (-0.51 %)

btc = 82 611.00$ 1 619.27 (2.00 %)

Kandinsky научился создавать анимационные видеоролики

1 минута на чтение
Kandinsky научился создавать анимационные видеоролики

На один промпт генерируется 4-секундное видео с частотой 24 кадра в секунду и разрешением 640×640 пикселей, пользователям доступно 16 эффектов анимации.‌‌‌‌

У пользователей нейросети Сбера Kandinsky 2.2 появилась возможность создавать видеоролики по текстовому описанию в режиме анимации. Генерация анимационных видеороликов работает в тестовом режиме и доступна самым активным пользователям Kandinsky 2.2, они уже начали получать приглашения.

До конца года оценить новые возможности нейросети смогут абсолютно все. Те пользователи, которые хотят попробовать новые возможности модели сейчас, могут оставить заявку на получение доступа в Telegram-боте.

Для того чтобы сгенерировать видео в режиме анимации, нужно описать текстом то, что хочется увидеть. Далее бот предложит на выбор 16 вариантов анимации сцены, а после этого нейросеть сгенерирует анимированный видеоролик. Также доступна генерация составных сцен: пользователь может ввести несколько текстовых описаний (до трёх), затем выбрать для каждого свою механику анимации, а после этого модель создаст «мини-фильм». Синтез одной секунды видео в среднем занимает около 20 секунд.

Основой для синтеза видео является модель генерации изображений по текстовым описаниям Kandinsky 2.2. Для расширения её возможностей реализовали разные виды анимации изображений, что позволило перемещать объекты, приближать и отдалять их, оживлять статику всеми возможными способами. В основе всех режимов анимации лежат функции image2image (перерисовка изображения по текстовому описанию) и inpainting/outpainting (дорисовка части изображения внутри и за его пределами), которые уже были реализованы в базовой модели.

Нейросеть разработали и обучили исследователи Sber AI совместно с учёными из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
ec57b364-495e-4a27-8e98-0f96e835e1c1-изображение-0

GigaChat Max: коротко о главном

Microsoft снова планирует запустить функцию Recall после скандала

Полная версия 
98135c11-356a-4aec-b850-001d9fc0092e-изображение-0

GigaChat Max: коротко о главном

Ритейлер назвал топ-5 часов по продажам в России

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Редакция рекомендует
Карьера
Блоги 339
X5 Tech
МТС
Газпромбанк
Сбер
Т-Банк
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131