16 сентября 2025

eur = 97.45 -1.88 (-1.89 %)

btc = 115 188.00$ - 284.02 (-0.25 %)

eth = 4 529.60$ -96.90 (-2.09 %)

ton = 3.15$ -0.06 (-1.72 %)

usd = 83.07 -1.31 (-1.55 %)

eur = 97.45 -1.88 (-1.89 %)

btc = 115 188.00$ - 284.02 (-0.25 %)

GigaChat сможет генерировать музыку по текстовому запросу

1 минута на чтение
GigaChat сможет генерировать музыку по текстовому запросу

Сбер намерен расширить возможности GigaChat, интегрировав туда нейросети CLaMP и SymFormer, рассказал в рамках международной конференции по искусственному интеллекту AI Journey 2023 вице-президент по цифровым поверхностям «Салют» Сбербанка Денис Филиппов.

Это позволит GigaChat генерировать музыкальные треки по произвольным текстовым запросам пользователей. Последнему будет достаточно сформулировать задачу, например, «сочини весёлую музыку в стиле кантри» или «напиши трек для лаундж-зоны бизнес-центра».

В ответ GigaChat пришлёт аудиофайл с уникальной музыкальной композицией и нотную партитуру в формате MIDI, которую можно будет использовать в собственных творческих проектах или в музыкальном продакшене.

Новые возможности GigaChat будут полезны не только музыкальным энтузиастам и представителям творческих профессий. Одним из сегментов целевой аудитории сервиса мы видим представителей среднего и малого предпринимательства. Благодаря GigaChat они смогут быстро, качественно и, что важно, абсолютно легально решать задачи бизнеса: создавать фоновое музыкальное сопровождение для кафе, салонов красоты и залов ожидания, генерировать треки для рекламных видеороликов и соцсетей, — отметил Филиппов.

В Сбере сообщили, что для обучения SymFormer использовались платформа ML Space на базе суперкомпьютера Christofari и датасет из более 200 тысяч композиций разных стилей: от классики до современной электронной музыки и рока.

При этом создание музыки таким образом происходит в несколько этапов. Сначала модель CLaMP обрабатывает запрос пользователя и конвертирует его в понятный для генератора мелодий язык. Затем в SymFormer генерируется несколько вариантов мультидорожечного трека, из которых нейросеть выбирает наиболее удачные варианты по стилю и композиции. На последнем этапе формируется аудиофайл и передаётся пользователю.

Заглавное изображение сгенерировано нейросетью Kandinsky 3.0 по запросу «музыка, созданная нейросетью».

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от ГигаЧат 
1-bg-изображение-0
img-content-1-изображение-0

ГигаЧат: коротко о главном

Как изменился Код Дурова вместе с ГигаЧат?

Узнай о всех возможностях в FAQ-статье 
Spotify расширила возможности бесплатных пользователей

ГигаЧат: коротко о главном

Spotify расширила возможности бесплатных пользователей

Полная версия 
«Магнит» запустил тестирование цифрового подтверждения возраста через мессенджер MAX«Магнит» запустил тестирование цифрового подтверждения возраста через мессенджер MAX«Магнит» запустил тестирование цифрового подтверждения возраста через мессенджер MAX

ГигаЧат: коротко о главном

«Магнит» запустил тестирование цифрового подтверждения возраста через мессенджер MAX

Полная версия 

Реализовано через ГигаЧат 

Сейчас читают
Редакция рекомендует
Карьера
Блоги 417
Газпромбанк
OTP Bank
Т-Банк
X5 Tech
билайн
МТС
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы