В Сбере создали нейросеть Kandinsky 2.1: она понимает русский язык и генерирует изображения в пару кликов
Читать первым в Telegram-канале «Код Дурова»
Text2image нейросети — это уже не просто модная игрушка, но и полезный инструмент для бизнеса. В Сбере обновили нейросеть Kandinsky, которая помогает создателям контента быстро генерировать изображения на разные темы, в разных стилях, под разные задачи.
Как устроена Kandinsky 2.1
Под капотом у Kandinsky 2.1 уникальная архитектура, которая позволяет создавать визуал на уровне лучших мировых нейросетей и так называемых перспективных технологий (state-of-the-art, SoTA).
Вот основные преимущества Kandinsky 2.1:
- Нейросеть работает по принципу text2image: вводите текстовый запрос или загружаете картинку, а ИИ сгенерирует, дорисует или объединит изображения по вашему описанию.
- Это первая и единственная в России диффузионная нейросеть, которая понимает больше 100 языков. Конечно, можно писать запросы и на русском.
- Воспользоваться нейросетью можно бесплатно и без регистрации на сайте.
Кому и когда может быть полезна нейросеть
Kandinsky 2.1 пригодится двум группам пользователей:
- Профессиональные контент-мейкеры. Например, дизайнеры и иллюстраторы.
- Непрофессиональные контент-мейкеры. Например, блогеры и преподаватели.
Нейросеть поможет создавать визуал не только для того, чтобы удивить друзей или подписчиков в соцсетях, но и для решения конкретной бизнес-задачи. Например, чтобы создать визуальный ряд для рекламы нового товара или придумать дизайн для будущих визиток.
В первую очередь Kandinsky 2.1 — это технологический помощник, которому креаторы делегируют рутину. Это пример сотворчества, когда любой человек может почувствовать себя творцом, а нейросеть становится подручным инструментом и помогает быстро и легко реализовывать гениальные идеи.
Как использовать Kandinsky 2.1
Интерфейс платформы интуитивно понятен и прост в использовании: просто вводите текстовый запрос и нажимайте кнопку «Создать».
Если у вас есть пожелания по стилю изображения, их можно прописать текстом или выбрать в специальном разделе. Пользователям доступно 20+ стилей: от аниме и советского мультфильма до хохломы и рисунка карандашом. Также можно выбрать стиль конкретного художника.
Придумать хороший промт и сгенерировать максимально подходящее изображение вам поможет эта инструкция.
- Выберите ключевой объект. Например, «кот», «машина», «стул». Если хотите объединить объекты используйте дефис: «кот-машина», «стул-колбаса». Учитывайте, что чем несовместимее два существительных, тем хуже получится генерация.
- Опишите объект прилагательными. Укажите размер, настроение, цвет, текстуру. Например, «грустный кот», «милый бегемот с бантиком», «веселый ребенок». Желательно использовать не больше 2-3 прилагательных.
- Определите, где объект должен находиться. Это могут быть небо, комната, берег реки. Желательно что-то максимально простое: «машина, дорога». Если конкретное место не хочется, можно добавить просто фон. Например, «медведь на белом фоне».
- Добавьте дополнительные элементы. Лучше что-то реальное: мячики, игрушки, листья, дом. Не стоит писать много элементов, иначе нейросеть сосредоточится на них и плохо проработает основной объект.
- Используйте эффекты для красочности. Например, «туман», «зеленое сияние», «блестки», «искры», «мрачность», «луч света», «зернистость», «блюр». Выбор огромный и зависит от вашей цели и фантазии.
- Выберите стиль. Здесь все просто: «жираф в стиле детского рисунка», «смартфон в стиле Дали», «самолет в стиле киберпанка». Лайфхак: выбирайте стиль, который гарантированно подходит вашей композиции и подчеркнет ее.
Где тестировать нейросеть
Есть несколько способов оценить возможности Kandinsky 2.1:
- на платформе Fusion Brain;
- на промо-странице модели;
- при помощи команды «Запусти художника» на умных устройствах Sber и в мобильном приложении «Салют»;
- на платформе ML Space в хабе предобученных моделей и датасетов DataHub;
- в Telegram-боте.
Чтобы начать экспериментировать, переходите на сайт и создавайте изображения в пару кликов. Это просто и бесплатно.