«Сбер» представил модель Emojich для создания эмодзи по текстовому описанию

«Сбер» представил Emojich — созданную на базе нейронной сети ruDALL-E (XL) модель, позволяющая пользователям создавать собственные эмодзи для общения в мессенджерах. Протестировать технологию можно в Telegram-боте, на сайте или в приложении «Салют».
Получившиеся эмодзи можно загрузить, например, в качестве стикеров в Telegram. Код модели доступен в официальном репозитории ruDALL-E на GitHub. Emojich считается «младшим братом» модели ruDALL-E с 1,3 млрд параметров, а также является продолжением развития мультимодального вектора в обучении нейросетей командой Sber AI.

Если ruDALL-E стал самым большим нейросетевым вычислительным проектом в России и СНГ, то Emojich можно считать первым официальным применением ruDALL-E и необходимым её развитием в продуктовом направлении, заявили в «Сбере».
Исполнительный вице-президент, СТО «Сбербанк Груп» Давид Рафаловский подчеркнул, что люди регулярно применяют язык эмодзи при общении в мессенджерах. При этом, по его словам, данный язык достаточно ограничен теми вариантами, которые предлагает та или иная коммуникационная платформа:
Поэтому нами была создана специальная модель для визуализации любой фразы в форме эмодзи. Для этого достаточно лишь описать желаемое и сгенерировать кастомизированный стикер или целый стикерпак. Уверен, что данный инструмент будет удобным и востребованным.
Напомним, ruDALL-E — это нейросеть, которая создана командами Sber AI и SberDevices. Данная модель может генерировать картинки по запросу на русском языке. ruDALL-E состоит из трёх взаимосвязанных нейросетей: одна обрабатывает текст и генерирует заданное число картинок, вторая выбирает самые удачные, а третья апскейлит их без потери качества.

По данным «Сбера», обучение нейросети заняло 23 тысячи GPU-часов на массиве данных из 120 млн пар текст-изображение и стало самым большим нейросетевым вычислительным проектом в России и СНГ.
Читать первым в Telegram-канале «Код Дурова»