Google выпустила новую версию Genie 3, способную генерировать игровые миры в реальном времени


GigaChat Max кратко объясняет суть статьи
DeepMind представила обновлённую версию генеративной модели виртуальных миров Genie 3, способную в реальном времени создавать и поддерживать интерактивные 3D-пространства. В отличие от предшественницы, новая модель позволяет пользователям длительно взаимодействовать с миром (до нескольких минут), сохраняя расположение объектов и визуальную память на протяжении около минуты. Генерируемые миры имеют разрешение 720p при 24 кадрах в секунду и поддерживают сценарные события, такие как изменение погоды или добавление персонажей. Ключевое преимущество технологии — полная автоматическая генерация окружения искусственным интеллектом без участия человека.
Google DeepMind анонсировала новую версию своей ИИ-модели создания виртуальных миров — Genie 3.
Она способна в реальном времени генерировать 3D-окружения. Теперь с этими мирами можно взаимодействовать гораздо дольше, а сама модель запоминает положение объектов даже если пользователь отвёл от них взгляд.
Так называемые World models (Модели мира) — это особый класс ИИ, который может создавать симулированные виртуальные пространства.
- Такие модели получают текстовый запрос и на его основе создают интерактивный мир, где можно свободно перемещаться, как в видеоигре.
- Главное отличие — всё окружение генерируется ИИ, а не создаётся вручную.

Genie 2, предыдущая версия, уже умела создавать миры по одной лишь картинке, но пользователи могли исследовать их лишь в течение 10–20 секунд. Теперь в Genie 3 продолжительность взаимодействия увеличена до нескольких минут.
Кроме того, модель сохраняет визуальную память объектов на протяжении примерно одной минуты. Если повернуться к стене с рисунком или доске с надписью, а затем отвернуться и снова взглянуть, всё останется на своих местах.
- Разрешение миров составляет 720p при 24 кадрах в секунду.
- Также Google добавила возможность «сценарных событий», которые запускаются по запросу. С их помощью можно, например, изменить погоду в мире или добавить новых персонажей.
Google активно инвестирует в развитие подобных технологий. Команду, работающую над мировыми моделями, возглавил один из бывших соавторов Sora, проекта по генерации видео от OpenAI.
Читать первым в Telegram-канале «Код Дурова»