Google создала нейросеть, которая генерирует картинки по описанию

2 минуты на чтение
Google создала нейросеть, которая генерирует картинки по описанию

Google создала нейросеть Imagen, которая способна генерировать изображения на основе текстового описания. Для распознавания текстового запроса нейросеть использует большие языковые модели, на которых основаны алгоритмы обработки естественной речи.

Далее алгоритмы улучшают схематичную картинку размером 64×64 до тех пор, пока искусственный интеллект не поймёт, что уже не может сделать её лучше по заданным параметрам. После этого размер изображения увеличивается 256 х 256 пикселей.

В результате изображение уже в высоком качестве доходит до размера 1024×1024. Это происходит не путём масштабирования — каждый из трёх этапов нейросеть улучшает детали на картинке.

Например, в первой версии изображения деталь может иметь ширину лишь 3 пикселя, а во второй — 12 пикселей, и так далее. В компании уверены, что её нейросеть генерирует изображения с «беспрецедентным фотореализмом».

Разработчики сравнили Imagen с аналогичной нейросетью DALL-E 2 от OpenAI. По данным Google, тестировщики при сравнении изображений от Imagen и DALL-E 2 чаще выбирали Imagen за более точную и достоверную работу.

Правда, в компании признали, что с запросом «лошадь верхом на астронавте» Imagen и DALL-E 2 не смогли справиться — нейросети постоянно ставят астронавта на лошадь, а не наоборот.

Imagen работает в режиме закрытой бета-версии и недоступна для всех желающих. Разработчики опасаются, что пользователи будут использовать нейросеть для генерации неприемлемых изображений, тем самым усугубляя принятые обществом предрассудки и стереотипы.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
e869037e-66eb-4d54-9c7a-450a1f477310-изображение-0

GigaChat Max: коротко о главном

Microsoft начала отказываться от паролей в пользу ключей доступа

Полная версия 
ec2f5058-1198-41e1-a89e-224dfbe7382b-изображение-0

GigaChat Max: коротко о главном

ЕС оштрафовал TikTok на €530 млн за передачу данных европейцев в Китай

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 345
билайн
Газпромбанк
Т-Банк
МТС
X5 Tech
Сбер
Яндекс Практикум
Ozon Tech
Циан
Банк 131