Stability AI выпустила новую модель для генерации изображений – Stable Diffusion XL 1.0

2 минуты на чтение
Stability AI выпустила новую модель для генерации изображений – Stable Diffusion XL 1.0

Стартап в области искусственного интеллекта, Stability AI, представил новую версию своего флагманского генератора изображений Stable Diffusion XL 1.0 (SDXL 1.0).

Эта модель с открытым исходным кодом, доступная на GitHub, предлагает «более яркие» и «точные» цвета, а также улучшенную контрастность, тени и освещение.

SDXL 1.0 является нашей самой продвинутой моделью на данный момент, — заявляет Stability AI.

Модель также доступна через API Stability и в потребительских приложениях Clipdrop и DreamStudio. Джо Пенна, руководитель отдела прикладного машинного обучения в Stability AI, в беседе с TechCrunch подчеркнул, что SDXL 1.0, содержащая 3,5 млрд параметров (для сравнения, в Stable Diffusion 1.5 их было около 850 млн), способна генерировать изображения с разрешением 1 мегапиксель «за секунды» и с различными соотношениями сторон.

Предшественник SDXL 1.0, Stable Diffusion XL 0.9, также мог создавать изображения высокого разрешения, но требовал больше вычислительной мощности. Открытый исходный код и возможность работы на более простом оборудовании делают SDXL 1.0 более доступной, чем конкуренты, отмечает SiliconANGLE.

SDXL 1.0 легко настраивается и адаптируется под различные концепции и стили. Она также проста в использовании и способна создавать сложные проекты с базовыми запросами на обработку естественного языка, — говорит Пенна.

SDXL 1.0 также улучшила генерацию текста. По словам Пенны, в то время как многие лучшие модели преобразования текста в изображение испытывают трудности с созданием разборчивых логотипов и шрифтов, SDXL 1.0 способна на «продвинутое» генерирование текста.

SDXL 1.0 включает встроенные функции inpainting (изменение и генерация выделенной области в изображении) и outpainting (расширение существующего изображения), а также img2img (генерация нового изображения на основе заданного) для создания более детализированных вариантов введённого изображения. Модель также способна обрабатывать сложные инструкции, состоящие из нескольких частей, представленных в виде коротких подсказок.

Отмечается, что тренировочный набор SDXL 1.0 включает работы художников, которые протестовали против использования их работ в качестве обучающих данных для генеративных моделей ИИ. Stability AI утверждает, что она защищена от юридической ответственности доктриной добросовестного использования, по крайней мере, в США. Однако это не помешало Getty Images подать иск против Stability AI за незаконное использование изображений сервиса для обучения своей генеративной нейросети.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
ace5efcf-6000-4180-aea1-2cf9c0c1ce81-изображение-010827fb3-c8c6-438f-ae6f-b0af58ba929e-изображение-1bbd14036-d9e9-4867-bc06-bff7bda7646f-изображение-2

GigaChat Max: коротко о главном

CMF представила наушники Buds 2a, Buds 2 и Buds 2 Plus. Цены в России

Полная версия 
74bd9822-9531-4c79-8cf3-b7ab78d7fbe4-изображение-0

GigaChat Max: коротко о главном

ВКонтакте упростила получение верификации

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 345
билайн
Газпромбанк
Т-Банк
МТС
X5 Tech
Сбер
Яндекс Практикум
Ozon Tech
Циан
Банк 131