Stability AI выпустила новую версию Stable Diffusion 3 Medium для генерации изображений
Читать первым в Telegram-канале «Код Дурова»
Компания Stability AI анонсировала запуск новой версии своей языковой модели под названием Stable Diffusion 3 Medium, которую разработчики характеризуют как «самую продвинутую открытую модель для генерации изображений».
Модель, имеющая 2 миллиарда параметров, способна создавать высококачественные изображения и работает на обычных потребительских видеокартах с минимальным объемом памяти в 5 ГБ, хотя для оптимальной производительности рекомендуется 16 ГБ.
Одним из ключевых улучшений в новой модели является повышенная качество генерации изображений человеческих лиц и рук, а также улучшенные возможности в области типографики и понимания текстовых запросов. Это позволяет SD3 Medium точно интерпретировать сложные текстовые описания и реалистично воссоздавать пространственное расположение элементов в сцене. Улучшения в архитектуре Diffusion Transformer обеспечивают более детализированные изображения на уровне мегапикселей.
Stability AI заявляет, что новая модель Stable Diffusion 3 Medium предназначена для использования на стандартных видеокартах, что делает её доступной для широкой аудитории пользователей. Компания подчеркивает своё намерение продолжать улучшать функциональность и производительность модели.
Пользователи могут начать тестирование SD3 Medium через API Stability или на сервере Stable Artisan в Discord, чтобы оценить новые возможности модели в действии.