Нейросеть Grok Imagine обновилась — теперь она может генерировать видео с речью на русском языке.
Подробнее об этом «Код Дурова» рассказывал в отдельной заметке.
Генеративная модель примечательна не только режимом Speech, но и режимом Spicy — можно создать видео с частично обнажёнными персонажами.
Рассказываем, что нужно сделать, чтобы сгенерировать 6-секундный ролик.
Шаг 1. Войдите в аккаунт
Перейдите на сайт Grok AI по этой ссылке. Учтите, что с российского IP-адреса нейросеть недоступна.

Войдите в аккаунт Grok. Если у вас есть профиль в X (Twitter) — можно войти через него. Если же нет — есть опции войти через аккаунты Google или Apple, а также по электронной почте.
Шаг 2. Начните с генерации фотографии
Процедура генерации видео в Grok несколько отличается от таковой в Sora и других подобных нейросетей.
Для начала перейдите в раздел Imagine по этой ссылке или выберите его в меню слева.

В окне ниже напишите, что вы хотите сгенерировать. Детально опишите фон, атмосферу, кто что делает на изображении. Помните, что сначала это будет только изображение, а не видео.
Можно приложить картинку-референс, если хотите использовать чьё-то лицо или какой-то конкретный объект.

Выберите один вариант из предложенных или скорректируйте запрос, если результат вас не удовлетворяет.

Шаг 3. От картинки — к видео
Под изображением вы увидите кнопку «Сделать видео», но не спешите на неё нажимать. Нажмите на стрелочку рядом с этой кнопкой — и вы увидите дополнительные стили, в которых можно создать ролик.

Вот на что влияет каждый из вариантов:
- Speech — можно указать прямую речь, которую произнесёт персонаж. Поддерживается в том числе и русский язык, но помните, что видео ограничены по длительности 6 секундами.
- Custom — можно описать сцену самостоятельно, то есть, полная свобода творчества.
- Spicy — режим 18+, который позволяет генерировать обнажённых персонажей и эротичные движения. Будьте осторожны при создании подобного контента и не забывайте о действующем законодательстве вашей страны.
- Fun — упрощённые анимации и юмористические ситуации. Режим для веселья.
- Normal — классический режим, который ничем не примечателен.
Выберите интересующий вас режим, введите запрос и дождитесь генерации. К счастью, в отличие от Sora 2, процесс создания видео занимает не 3–5 минут, а всего 15–20 секунд.
Всё готово — видеоролик создан. Что с ним можно ещё сделать?
Шаг 4. Допиливание видео
Если результат вас не удовлетворил, можно повторить процесс генерации заново. Учтите, что предыдущий результат может не сохраниться.
Более того, «добавлять итерации» друг на друга не получится — если вы создали одно видео в режиме Speech, то повторная генерация в режиме Fun уберёт речь с видеоролика.
Вот что получилось сгенерировать у нас:
Шаг 5. Сохранение видео
Сохранить получившееся видео можно при помощи соответствующей кнопки под ним.

За что отвечают другие кнопки?
- Кнопка с сердечком — поставить «лайк» на видео, чтобы оно сохранилось в ваших генерациях.
- «Палец вниз» — кнопка «дизлайка», она даст знать разработчикам, что с результатом что-то не так.
- «Поделиться» — скопирует публичную ссылку на видео в буфер обмена, после чего ей можно будет поделиться с друзьями или в социальных сетях.
На какие результаты можно рассчитывать?
Модель Grok Imagine, несмотря на то, что её обновили до версии 0.9, справляется с генерацией хуже, чем Sora 2. Речь звучит неестественно, продолжительность составляет всего 6 секунд, а иногда результаты могут быть непредсказуемыми.
Однако важно помнить, что модель существует всего лишь с августа 2025 года — она только в начале своего развития.
Пробуйте несколько раз, дополняйте свои запросы деталями — и всё обязательно получится. У Grok Imagine есть лимиты — для бесплатных пользователей действует ограничение в 10–20 видеороликов за 24 часа.
Помимо этого, у Grok есть мобильные приложения в App Store и Google Play, но они недоступны в российском регионе.
Читать первым в Telegram-канале «Код Дурова»