26 июня 2025

eur = 91.74 1.90 (2.11 %)

btc = 107 267.00$ 1 558.07 (1.47 %)

eth = 2 414.57$ -21.38 (-0.88 %)

ton = 2.85$ -0.06 (-1.90 %)

usd = 78.39 0.10 (0.12 %)

eur = 91.74 1.90 (2.11 %)

btc = 107 267.00$ 1 558.07 (1.47 %)

Google представила Imagen 4 — модель для генерации изображений с улучшенным качеством текста

2 минуты на чтение
Google представила Imagen 4 — модель для генерации изображений с улучшенным качеством текста

GigaChat Max кратко объясняет суть статьи

Google представила обновлённую модель генерации изображений Imagen 4 и её улучшенную версию Imagen 4 Ultra. Новая модель значительно повысила точность воспроизведения текста на картинках, позволяя чётко отображать надписи и детали. Доступны две версии: базовая Imagen 4 для массовых запросов и премиальная Imagen 4 Ultra с повышенной точностью, требующая больше ресурсов и имеющая повышенную стоимость ($0.04 и $0.06 соответственно). Модель доступна бесплатно в Google AI Studio (кроме российских пользователей), а также через платный Gemini API. Предыдущая версия Imagen 3 была выпущена в мае 2024 года и уже демонстрировала значительные улучшения в качестве и точности.

Google анонсировала новую модель для генерации изображений Imagen 4, а также её продвинутую версию Imagen 4 Ultra. По заявлению компании, она стала заметно лучшее в качество отрисовки текста, чего в подобных моделях до сих пор достигали с трудом.

Модель обучена на обширных датасетах и позволяет не только создавать детализированные картинки по текстовому описанию, но и более точно воспроизводить надписи, как отдельные фразы, так и текст, встроенный в объекты.

Google представила Imagen 4 — модель для генерации изображений с улучшенным качеством текста

Например, если в промпте указано, что на космическом корабле должно быть написано «Звездная пыль», модель действительно рендерит читаемую надпись на корпусе, а не искажённый набор символов, как это часто случалось раньше.

Google представила Imagen 4 — модель для генерации изображений с улучшенным качеством текста

Google выпустила сразу две версии:

  • Imagen 4 — универсальная модель для широкой аудитории и типовых запросов;
  • Imagen 4 Ultra — более точная и мощная версия, предназначенная для генерации изображений, максимально соответствующих тексту. Она требует чуть больше ресурсов и стоит дороже.
Google представила Imagen 4 — модель для генерации изображений с улучшенным качеством текста

Модель доступна:

  • Бесплатно в Google AI Studio (но не открывается с российских IP);
  • Через Gemini API — по цене $0.04 за обычное изображение и $0.06 за изображение, созданное Ultra-версией.
  • В чат-боте Gemini модель пока недоступна, но Google обещает добавить её позднее. Подписка на генерацию через AI Studio появится в ближайшие недели.

Предыдущая версия Imagen 3 вышла в мае 2024 года и уже тогда делала заметные шаги в сторону качества и текстовой точности. Imagen 4 продолжает это направление, ставя акцент на реалистичность, детализацию и внятный текст на изображениях.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
a7519e9c-5056-4bc0-91d7-c074c25a6bbf-изображение-0

GigaChat Max: коротко о главном

Фёдор Минькин на GigaConf 2025: уникальность GigaChat состоит в фокусе на русскоязычных пользователей

Полная версия 
7484487c-6a02-45ac-b374-582c74cb1fc0-изображение-0d2136239-cc3b-4002-893c-bc7e75221f38-изображение-196b95c47-e0b3-42bf-aff2-03017ae673a4-изображение-2

GigaChat Max: коротко о главном

Google представила Imagen 4 модель для генерации изображений с улучшенным качеством текста

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 366
X5 Tech
Газпромбанк
билайн
Сбер
Т-Банк
МТС
Яндекс Практикум
Ozon Tech
Циан
Банк 131

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы