Илон Маск рассказал, что модель Grok Imagine обновлена с версии 0.1 до версии 0.9.
Нейросеть стала генерировать видео значительно быстрее и точнее, а в доступных режимах появился Speech — в нём можно прописать речь для персонажа. Поддерживается и русский язык, но модель не всегда попадает в интонации, а движения губ не синхронизированы с речью.
Наш пример генерации, где Сэм Альтман должен был сказать, что Sora 2 больше не нужна:
Видео с генеральным директором OpenAI в режиме Spicy нейросеть Маска генерировать отказалась.
Генерация видео в среднем занимает 15–25 секунд, тогда как Sora 2 создаёт ролик в среднем за 5 минут. Однако длительность видео у Grok Imagine ограничена шестью секундами.
Читать первым в Telegram-канале «Код Дурова»

























































