25 июня 2025

eur = 91.74 1.90 (2.11 %)

btc = 106 595.00$ 1 510.52 (1.44 %)

eth = 2 456.67$ 53.41 (2.22 %)

ton = 2.91$ 0.02 (0.59 %)

usd = 78.39 0.10 (0.12 %)

eur = 91.74 1.90 (2.11 %)

btc = 106 595.00$ 1 510.52 (1.44 %)

Google создала нейросеть, которая генерирует картинки по описанию

2 минуты на чтение
Google создала нейросеть, которая генерирует картинки по описанию

Google создала нейросеть Imagen, которая способна генерировать изображения на основе текстового описания. Для распознавания текстового запроса нейросеть использует большие языковые модели, на которых основаны алгоритмы обработки естественной речи.

Далее алгоритмы улучшают схематичную картинку размером 64×64 до тех пор, пока искусственный интеллект не поймёт, что уже не может сделать её лучше по заданным параметрам. После этого размер изображения увеличивается 256 х 256 пикселей.

В результате изображение уже в высоком качестве доходит до размера 1024×1024. Это происходит не путём масштабирования — каждый из трёх этапов нейросеть улучшает детали на картинке.

Например, в первой версии изображения деталь может иметь ширину лишь 3 пикселя, а во второй — 12 пикселей, и так далее. В компании уверены, что её нейросеть генерирует изображения с «беспрецедентным фотореализмом».

Разработчики сравнили Imagen с аналогичной нейросетью DALL-E 2 от OpenAI. По данным Google, тестировщики при сравнении изображений от Imagen и DALL-E 2 чаще выбирали Imagen за более точную и достоверную работу.

Правда, в компании признали, что с запросом «лошадь верхом на астронавте» Imagen и DALL-E 2 не смогли справиться — нейросети постоянно ставят астронавта на лошадь, а не наоборот.

Imagen работает в режиме закрытой бета-версии и недоступна для всех желающих. Разработчики опасаются, что пользователи будут использовать нейросеть для генерации неприемлемых изображений, тем самым усугубляя принятые обществом предрассудки и стереотипы.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
9f5d5658-be1e-4ce0-bbd2-0f227b9d87de-изображение-0

GigaChat Max: коротко о главном

GitVerse позволит мгновенно создавать веб-приложения при помощи генеративного ИИ

Полная версия 
58a85d11-2fb1-4be9-bfc0-2860f2251b5a-изображение-0

GigaChat Max: коротко о главном

Сбер представил GigaCode 2.0 — улучшенного AI-ассистента для разработчиков

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 365
Газпромбанк
билайн
Сбер
Т-Банк
X5 Tech
МТС
Яндекс Практикум
Ozon Tech
Циан
Банк 131

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы