В Китае разработали нейросеть, способную генерировать короткие видео по заданному тексту
Китайские специалисты разработали нейросеть под названием CogVideo. С её помощью можно по текстовому описанию создать короткие видео (GIF) с частотой кадров 32 за 4 секунды.
Ввод исходного текста осуществляется на китайском языке. Пока что на GitHub опубликовали лишь примеры созданных видео и раскадровку. Алгоритм обучен на 5,4 миллионах пар текстов-видео.
![](https://i.kod.ru/rs:fill/w:736/q:85/plain/https%3A%2F%2Fkod.ru%2Fcontent%2Fimages%2F2022%2F05%2F-----------_2022-06-01_001320764.png)
Нейросеть использует наработки DALL-E 2 от OpenAI и Imagine от Google, последняя генерирует картинки по текстовому описанию, а DALL-E 2 улучшает их качество.