В Сбере создали нейросеть Kandinsky 2.1: она понимает русский язык и генерирует изображения в пару кликов

2,1к

3 минуты на чтение

В Сбере создали нейросеть Kandinsky 2.1: она понимает русский язык и генерирует изображения в пару кликов

Text2image нейросети — это уже не просто модная игрушка, но и полезный инструмент для бизнеса. В Сбере обновили нейросеть Kandinsky, которая помогает создателям контента быстро генерировать изображения на разные темы, в разных стилях, под разные задачи.

Как устроена Kandinsky 2.1

Под капотом у Kandinsky 2.1 уникальная архитектура, которая позволяет создавать визуал на уровне лучших мировых нейросетей и так называемых перспективных технологий (state-of-the-art, SoTA).

Вот основные преимущества Kandinsky 2.1:

Нейросеть работает по принципу text2image: вводите текстовый запрос или загружаете картинку, а ИИ сгенерирует, дорисует или объединит изображения по вашему описанию.
Это первая и единственная в России диффузионная нейросеть, которая понимает больше 100 языков. Конечно, можно писать запросы и на русском.
Воспользоваться нейросетью можно бесплатно и без регистрации на сайте.

Кому и когда может быть полезна нейросеть

Kandinsky 2.1 пригодится двум группам пользователей:

Профессиональные контент-мейкеры. Например, дизайнеры и иллюстраторы.
Непрофессиональные контент-мейкеры. Например, блогеры и преподаватели.

Нейросеть поможет создавать визуал не только для того, чтобы удивить друзей или подписчиков в соцсетях, но и для решения конкретной бизнес-задачи. Например, чтобы создать визуальный ряд для рекламы нового товара или придумать дизайн для будущих визиток.

В первую очередь Kandinsky 2.1 — это технологический помощник, которому креаторы делегируют рутину. Это пример сотворчества, когда любой человек может почувствовать себя творцом, а нейросеть становится подручным инструментом и помогает быстро и легко реализовывать гениальные идеи.

Как использовать Kandinsky 2.1

Интерфейс платформы интуитивно понятен и прост в использовании: просто вводите текстовый запрос и нажимайте кнопку «Создать».

Если у вас есть пожелания по стилю изображения, их можно прописать текстом или выбрать в специальном разделе. Пользователям доступно 20+ стилей: от аниме и советского мультфильма до хохломы и рисунка карандашом. Также можно выбрать стиль конкретного художника.

Придумать хороший промт и сгенерировать максимально подходящее изображение вам поможет эта инструкция.

Выберите ключевой объект. Например, «кот», «машина», «стул». Если хотите объединить объекты используйте дефис: «кот-машина», «стул-колбаса». Учитывайте, что чем несовместимее два существительных, тем хуже получится генерация.
Опишите объект прилагательными. Укажите размер, настроение, цвет, текстуру. Например, «грустный кот», «милый бегемот с бантиком», «веселый ребенок». Желательно использовать не больше 2-3 прилагательных.
Определите, где объект должен находиться. Это могут быть небо, комната, берег реки. Желательно что-то максимально простое: «машина, дорога». Если конкретное место не хочется, можно добавить просто фон. Например, «медведь на белом фоне».
Добавьте дополнительные элементы. Лучше что-то реальное: мячики, игрушки, листья, дом. Не стоит писать много элементов, иначе нейросеть сосредоточится на них и плохо проработает основной объект.
Используйте эффекты для красочности. Например, «туман», «зеленое сияние», «блестки», «искры», «мрачность», «луч света», «зернистость», «блюр». Выбор огромный и зависит от вашей цели и фантазии.
Выберите стиль. Здесь все просто: «жираф в стиле детского рисунка», «смартфон в стиле Дали», «самолет в стиле киберпанка». Лайфхак: выбирайте стиль, который гарантированно подходит вашей композиции и подчеркнет ее.

Где тестировать нейросеть

Есть несколько способов оценить возможности Kandinsky 2.1:

на платформе Fusion Brain;
на промо-странице модели;
при помощи команды «Запусти художника» на умных устройствах Sber и в мобильном приложении «Салют»;
на платформе ML Space в хабе предобученных моделей и датасетов DataHub;
в Telegram-боте.

Чтобы начать экспериментировать, переходите на сайт и создавайте изображения в пару кликов. Это просто и бесплатно.

Читать первым в Telegram-канале «Код Дурова»