Stability AI выпустила новую модель для генерации изображений – Stable Diffusion XL 1.0
Стартап в области искусственного интеллекта, Stability AI, представил новую версию своего флагманского генератора изображений Stable Diffusion XL 1.0 (SDXL 1.0).
Эта модель с открытым исходным кодом, доступная на GitHub, предлагает «более яркие» и «точные» цвета, а также улучшенную контрастность, тени и освещение.
SDXL 1.0 является нашей самой продвинутой моделью на данный момент, — заявляет Stability AI.
Модель также доступна через API Stability и в потребительских приложениях Clipdrop и DreamStudio. Джо Пенна, руководитель отдела прикладного машинного обучения в Stability AI, в беседе с TechCrunch подчеркнул, что SDXL 1.0, содержащая 3,5 млрд параметров (для сравнения, в Stable Diffusion 1.5 их было около 850 млн), способна генерировать изображения с разрешением 1 мегапиксель «за секунды» и с различными соотношениями сторон.
Предшественник SDXL 1.0, Stable Diffusion XL 0.9, также мог создавать изображения высокого разрешения, но требовал больше вычислительной мощности. Открытый исходный код и возможность работы на более простом оборудовании делают SDXL 1.0 более доступной, чем конкуренты, отмечает SiliconANGLE.
SDXL 1.0 легко настраивается и адаптируется под различные концепции и стили. Она также проста в использовании и способна создавать сложные проекты с базовыми запросами на обработку естественного языка, — говорит Пенна.
SDXL 1.0 также улучшила генерацию текста. По словам Пенны, в то время как многие лучшие модели преобразования текста в изображение испытывают трудности с созданием разборчивых логотипов и шрифтов, SDXL 1.0 способна на «продвинутое» генерирование текста.
SDXL 1.0 включает встроенные функции inpainting (изменение и генерация выделенной области в изображении) и outpainting (расширение существующего изображения), а также img2img (генерация нового изображения на основе заданного) для создания более детализированных вариантов введённого изображения. Модель также способна обрабатывать сложные инструкции, состоящие из нескольких частей, представленных в виде коротких подсказок.
Отмечается, что тренировочный набор SDXL 1.0 включает работы художников, которые протестовали против использования их работ в качестве обучающих данных для генеративных моделей ИИ. Stability AI утверждает, что она защищена от юридической ответственности доктриной добросовестного использования, по крайней мере, в США. Однако это не помешало Getty Images подать иск против Stability AI за незаконное использование изображений сервиса для обучения своей генеративной нейросети.
Читать первым в Telegram-канале «Код Дурова»