Читать первым в Telegram-канале «Код Дурова»
Компания OpenAI, известная своим чат-ботом ChatGPT, представила генеративную модель искусственного интеллекта под названием Sora. Она позволяет генерировать видео по текстовому описанию.
Sora — это диффузионная модель, которая способна «создавать сложные сцены с несколькими персонажами, определенными типами движения и точными деталями объекта и фона». На сайте проекта сказано, что модель умеет понимать подсказки и знает, как ведут себя различные объекты в физическом мире.
Что важно, так это тот факт, что Sora генерирует целое видео сразу, а не покадрово. Это помогает избежать того, что было проблемой при использовании других подходов — изменения объекта при движении или перемещении камеры.
Модель в том числе способна генерировать видео на основе статичных изображений, а также заполнять недостающие кадры в существующих роликах или расширять их.
Пока нейросеть недоступна для общего использования. Её предоставили только некоторым художникам, дизайнерам и режиссёрам, которые смогут поделиться своими отзывами с разработчиками. Даты появления общедоступной версии пока нет.