Google выпустила новую версию Genie 3, способную генерировать игровые миры в реальном времени


ГигаЧат кратко объясняет суть статьи
DeepMind представила обновлённую версию генеративной модели виртуальных миров Genie 3, способную в реальном времени создавать и поддерживать интерактивные 3D-пространства на основе текстовых запросов. В отличие от предыдущей версии, позволяющей исследовать миры всего несколько секунд, новая модель поддерживает взаимодействие до нескольких минут и запоминает расположение объектов около минуты после ухода из поля зрения пользователя. Генерируемые миры имеют разрешение 720p при 24 кадрах в секунду и поддерживают сценарные события, такие как изменение погоды или добавление персонажей. Руководит проектом бывший разработчик OpenAI, ранее участвовавший в создании видеогенератора Sora.
Google DeepMind анонсировала новую версию своей ИИ-модели создания виртуальных миров — Genie 3.
Она способна в реальном времени генерировать 3D-окружения. Теперь с этими мирами можно взаимодействовать гораздо дольше, а сама модель запоминает положение объектов даже если пользователь отвёл от них взгляд.
Так называемые World models (Модели мира) — это особый класс ИИ, который может создавать симулированные виртуальные пространства.
- Такие модели получают текстовый запрос и на его основе создают интерактивный мир, где можно свободно перемещаться, как в видеоигре.
- Главное отличие — всё окружение генерируется ИИ, а не создаётся вручную.

Genie 2, предыдущая версия, уже умела создавать миры по одной лишь картинке, но пользователи могли исследовать их лишь в течение 10–20 секунд. Теперь в Genie 3 продолжительность взаимодействия увеличена до нескольких минут.
Кроме того, модель сохраняет визуальную память объектов на протяжении примерно одной минуты. Если повернуться к стене с рисунком или доске с надписью, а затем отвернуться и снова взглянуть, всё останется на своих местах.
- Разрешение миров составляет 720p при 24 кадрах в секунду.
- Также Google добавила возможность «сценарных событий», которые запускаются по запросу. С их помощью можно, например, изменить погоду в мире или добавить новых персонажей.
Google активно инвестирует в развитие подобных технологий. Команду, работающую над мировыми моделями, возглавил один из бывших соавторов Sora, проекта по генерации видео от OpenAI.
Читать первым в Telegram-канале «Код Дурова»