ГигаЧат кратко объясняет суть статьи
Grok Imagine обновилась с версии 0.1 до 0.9: теперь она генерирует видео быстрее и точнее, добавлен режим Speech с поддержкой русского языка (интонация и синхронизация движений губ несовершенны). Средняя скорость генерации — 15-25 секунд против 5 минут у Sora 2, но длина роликов ограничена 6 секундами. Доступ к модели предоставляется по приглашению и доступен только жителям США и Канады.
Илон Маск рассказал, что модель Grok Imagine обновлена с версии 0.1 до версии 0.9.
Нейросеть стала генерировать видео значительно быстрее и точнее, а в доступных режимах появился Speech — в нём можно прописать речь для персонажа. Поддерживается и русский язык, но модель не всегда попадает в интонации, а движения губ не синхронизированы с речью.
Наш пример генерации, где Сэм Альтман должен был сказать, что Sora 2 больше не нужна:
Видео с генеральным директором OpenAI в режиме Spicy нейросеть Маска генерировать отказалась.
Генерация видео в среднем занимает 15–25 секунд, тогда как Sora 2 создаёт ролик в среднем за 5 минут. Однако длительность видео у Grok Imagine ограничена шестью секундами.
Читать первым в Telegram-канале «Код Дурова»