11 июля 2025

eur = 91.42 -0.55 (-0.60 %)

btc = 118 313.00$ 7 278.39 (6.56 %)

eth = 3 006.71$ 231.45 (8.34 %)

ton = 2.97$ 0.10 (3.31 %)

usd = 78.17 0.00 (0.01 %)

eur = 91.42 -0.55 (-0.60 %)

btc = 118 313.00$ 7 278.39 (6.56 %)

Google представила Imagen 4 — модель для генерации изображений с улучшенным качеством текста

2 минуты на чтение
Google представила Imagen 4 — модель для генерации изображений с улучшенным качеством текстаКак видит новость Kandinsky

GigaChat Max кратко объясняет суть статьи

Google представила обновлённую модель генерации изображений Imagen 4 и её улучшенную версию Imagen 4 Ultra. Новая модель значительно повысила точность воспроизведения текста на картинках, позволяя чётко отображать надписи и детали. Доступны две версии: базовая Imagen 4 для массовых запросов и премиальная Imagen 4 Ultra с повышенной точностью, требующая больше ресурсов и имеющая повышенную стоимость ($0.04 и $0.06 соответственно). Модель доступна бесплатно в Google AI Studio (кроме российских пользователей), а также через платный Gemini API. Предыдущая версия Imagen 3 была выпущена в мае 2024 года и уже демонстрировала значительные улучшения в качестве и точности.

Google анонсировала новую модель для генерации изображений Imagen 4, а также её продвинутую версию Imagen 4 Ultra. По заявлению компании, она стала заметно лучшее в качество отрисовки текста, чего в подобных моделях до сих пор достигали с трудом.

Модель обучена на обширных датасетах и позволяет не только создавать детализированные картинки по текстовому описанию, но и более точно воспроизводить надписи, как отдельные фразы, так и текст, встроенный в объекты.

Google представила Imagen 4 — модель для генерации изображений с улучшенным качеством текста

Например, если в промпте указано, что на космическом корабле должно быть написано «Звездная пыль», модель действительно рендерит читаемую надпись на корпусе, а не искажённый набор символов, как это часто случалось раньше.

Google представила Imagen 4 — модель для генерации изображений с улучшенным качеством текста

Google выпустила сразу две версии:

  • Imagen 4 — универсальная модель для широкой аудитории и типовых запросов;
  • Imagen 4 Ultra — более точная и мощная версия, предназначенная для генерации изображений, максимально соответствующих тексту. Она требует чуть больше ресурсов и стоит дороже.
Google представила Imagen 4 — модель для генерации изображений с улучшенным качеством текста

Модель доступна:

  • Бесплатно в Google AI Studio (но не открывается с российских IP);
  • Через Gemini API — по цене $0.04 за обычное изображение и $0.06 за изображение, созданное Ultra-версией.
  • В чат-боте Gemini модель пока недоступна, но Google обещает добавить её позднее. Подписка на генерацию через AI Studio появится в ближайшие недели.

Предыдущая версия Imagen 3 вышла в мае 2024 года и уже тогда делала заметные шаги в сторону качества и текстовой точности. Imagen 4 продолжает это направление, ставя акцент на реалистичность, детализацию и внятный текст на изображениях.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
YouTube меняет принцип показа рекламы для русскоязычных пользователейYouTube меняет принцип показа рекламы для русскоязычных пользователей

GigaChat Max: коротко о главном

YouTube меняет принцип показа рекламы для русскоязычных пользователей

Полная версия 
Хакеры взломали бота McDonald’s паролём «123456» и получили доступ к данным 64 млн соискателей работы

GigaChat Max: коротко о главном

Хакеры взломали бота McDonald’s паролём «123456» и получили доступ к данным 64 млн соискателей работы

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 375
Газпромбанк
Сбер
OTP Bank
Т-Банк
X5 Tech
билайн
МТС
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы