Stability AI выпустила новую модель для генерации изображений – Stable Diffusion XL 1.0

2 минуты на чтение

Stability AI выпустила новую модель для генерации изображений – Stable Diffusion XL 1.0

Читайте в Telegram

Стартап в области искусственного интеллекта, Stability AI, представил новую версию своего флагманского генератора изображений Stable Diffusion XL 1.0 (SDXL 1.0).

Эта модель с открытым исходным кодом, доступная на GitHub, предлагает «более яркие» и «точные» цвета, а также улучшенную контрастность, тени и освещение.

SDXL 1.0 является нашей самой продвинутой моделью на данный момент, — заявляет Stability AI.

Модель также доступна через API Stability и в потребительских приложениях Clipdrop и DreamStudio. Джо Пенна, руководитель отдела прикладного машинного обучения в Stability AI, в беседе с TechCrunch подчеркнул, что SDXL 1.0, содержащая 3,5 млрд параметров (для сравнения, в Stable Diffusion 1.5 их было около 850 млн), способна генерировать изображения с разрешением 1 мегапиксель «за секунды» и с различными соотношениями сторон.

Предшественник SDXL 1.0, Stable Diffusion XL 0.9, также мог создавать изображения высокого разрешения, но требовал больше вычислительной мощности. Открытый исходный код и возможность работы на более простом оборудовании делают SDXL 1.0 более доступной, чем конкуренты, отмечает SiliconANGLE.

SDXL 1.0 легко настраивается и адаптируется под различные концепции и стили. Она также проста в использовании и способна создавать сложные проекты с базовыми запросами на обработку естественного языка, — говорит Пенна.

SDXL 1.0 также улучшила генерацию текста. По словам Пенны, в то время как многие лучшие модели преобразования текста в изображение испытывают трудности с созданием разборчивых логотипов и шрифтов, SDXL 1.0 способна на «продвинутое» генерирование текста.

SDXL 1.0 включает встроенные функции inpainting (изменение и генерация выделенной области в изображении) и outpainting (расширение существующего изображения), а также img2img (генерация нового изображения на основе заданного) для создания более детализированных вариантов введённого изображения. Модель также способна обрабатывать сложные инструкции, состоящие из нескольких частей, представленных в виде коротких подсказок.

Отмечается, что тренировочный набор SDXL 1.0 включает работы художников, которые протестовали против использования их работ в качестве обучающих данных для генеративных моделей ИИ. Stability AI утверждает, что она защищена от юридической ответственности доктриной добросовестного использования, по крайней мере, в США. Однако это не помешало Getty Images подать иск против Stability AI за незаконное использование изображений сервиса для обучения своей генеративной нейросети.

Обсудить

МегаФон обнулит трафик на Облако Mail с 13 по 19 мая для переноса данных из iCloud

Московский суд запретил портал «ЯПлакалъ» и два сайта с анекдотами

Минпромторг поддержал НДС в 22% на зарубежные интернет-заказы с 2027 года

В ChatGPT появилась модель GPT-5.5 Instant — меньше галлюцинаций и лучшие результаты в тестах

Google, Microsoft и xAI будут предоставлять США доступ к ИИ-моделям до публичного релиза

Apple выплатит $250 млн за задержку с внедрением ИИ в Siri