8 июля 2025

eur = 92.41 -0.60 (-0.64 %)

btc = 108 444.00$ 304.69 (0.28 %)

eth = 2 549.67$ 31.71 (1.26 %)

ton = 2.78$ -0.13 (-4.32 %)

usd = 78.72 -0.12 (-0.15 %)

eur = 92.41 -0.60 (-0.64 %)

btc = 108 444.00$ 304.69 (0.28 %)

Kandinsky научился создавать анимационные видеоролики

1 минута на чтение
Kandinsky научился создавать анимационные видеоролики

На один промпт генерируется 4-секундное видео с частотой 24 кадра в секунду и разрешением 640×640 пикселей, пользователям доступно 16 эффектов анимации.‌‌‌‌

У пользователей нейросети Сбера Kandinsky 2.2 появилась возможность создавать видеоролики по текстовому описанию в режиме анимации. Генерация анимационных видеороликов работает в тестовом режиме и доступна самым активным пользователям Kandinsky 2.2, они уже начали получать приглашения.

До конца года оценить новые возможности нейросети смогут абсолютно все. Те пользователи, которые хотят попробовать новые возможности модели сейчас, могут оставить заявку на получение доступа в Telegram-боте.

Для того чтобы сгенерировать видео в режиме анимации, нужно описать текстом то, что хочется увидеть. Далее бот предложит на выбор 16 вариантов анимации сцены, а после этого нейросеть сгенерирует анимированный видеоролик. Также доступна генерация составных сцен: пользователь может ввести несколько текстовых описаний (до трёх), затем выбрать для каждого свою механику анимации, а после этого модель создаст «мини-фильм». Синтез одной секунды видео в среднем занимает около 20 секунд.

Основой для синтеза видео является модель генерации изображений по текстовым описаниям Kandinsky 2.2. Для расширения её возможностей реализовали разные виды анимации изображений, что позволило перемещать объекты, приближать и отдалять их, оживлять статику всеми возможными способами. В основе всех режимов анимации лежат функции image2image (перерисовка изображения по текстовому описанию) и inpainting/outpainting (дорисовка части изображения внутри и за его пределами), которые уже были реализованы в базовой модели.

Нейросеть разработали и обучили исследователи Sber AI совместно с учёными из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
Власти разрабатывают стратегию развития игровой индустрии в России

GigaChat Max: коротко о главном

Власти разрабатывают стратегию развития игровой индустрии в России

Полная версия 
В TON Foundation подтвердили, что выдача «золотых виз» ОАЭ за Toncoin — частный проект

GigaChat Max: коротко о главном

В TON Foundation подтвердили, что выдача «золотых виз» ОАЭ за Toncoin — частный проект

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 371
Газпромбанк
OTP Bank
Т-Банк
X5 Tech
билайн
Сбер
МТС
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы