Google выпустила новую версию Genie 3, способную генерировать игровые миры в реальном времени

Google DeepMind анонсировала новую версию своей ИИ-модели создания виртуальных миров — Genie 3.

Она способна в реальном времени генерировать 3D-окружения. Теперь с этими мирами можно взаимодействовать гораздо дольше, а сама модель запоминает положение объектов даже если пользователь отвёл от них взгляд.

Так называемые World models (Модели мира) — это особый класс ИИ, который может создавать симулированные виртуальные пространства.

  • Такие модели получают текстовый запрос и на его основе создают интерактивный мир, где можно свободно перемещаться, как в видеоигре.
  • Главное отличие — всё окружение генерируется ИИ, а не создаётся вручную.

Genie 2, предыдущая версия, уже умела создавать миры по одной лишь картинке, но пользователи могли исследовать их лишь в течение 10–20 секунд. Теперь в Genie 3 продолжительность взаимодействия увеличена до нескольких минут.

Кроме того, модель сохраняет визуальную память объектов на протяжении примерно одной минуты. Если повернуться к стене с рисунком или доске с надписью, а затем отвернуться и снова взглянуть, всё останется на своих местах.

  • Разрешение миров составляет 720p при 24 кадрах в секунду.
  • Также Google добавила возможность «сценарных событий», которые запускаются по запросу. С их помощью можно, например, изменить погоду в мире или добавить новых персонажей.

Google активно инвестирует в развитие подобных технологий. Команду, работающую над мировыми моделями, возглавил один из бывших соавторов Sora, проекта по генерации видео от OpenAI.