19 февраля 2025

eur = 95.80 0.92 (0.97 %)

btc = 95 188.00$ - 879.43 (-0.92 %)

eth = 2 657.30$ -94.15 (-3.42 %)

ton = 3.65$ -0.13 (-3.49 %)

usd = 91.43 1.12 (1.25 %)

eur = 95.80 0.92 (0.97 %)

btc = 95 188.00$ - 879.43 (-0.92 %)

Форум

GigaChat сможет генерировать музыку по текстовому запросу

1 минута на чтение
GigaChat сможет генерировать музыку по текстовому запросу

Сбер намерен расширить возможности GigaChat, интегрировав туда нейросети CLaMP и SymFormer, рассказал в рамках международной конференции по искусственному интеллекту AI Journey 2023 вице-президент по цифровым поверхностям «Салют» Сбербанка Денис Филиппов.

Это позволит GigaChat генерировать музыкальные треки по произвольным текстовым запросам пользователей. Последнему будет достаточно сформулировать задачу, например, «сочини весёлую музыку в стиле кантри» или «напиши трек для лаундж-зоны бизнес-центра».

В ответ GigaChat пришлёт аудиофайл с уникальной музыкальной композицией и нотную партитуру в формате MIDI, которую можно будет использовать в собственных творческих проектах или в музыкальном продакшене.

Новые возможности GigaChat будут полезны не только музыкальным энтузиастам и представителям творческих профессий. Одним из сегментов целевой аудитории сервиса мы видим представителей среднего и малого предпринимательства. Благодаря GigaChat они смогут быстро, качественно и, что важно, абсолютно легально решать задачи бизнеса: создавать фоновое музыкальное сопровождение для кафе, салонов красоты и залов ожидания, генерировать треки для рекламных видеороликов и соцсетей, — отметил Филиппов.

В Сбере сообщили, что для обучения SymFormer использовались платформа ML Space на базе суперкомпьютера Christofari и датасет из более 200 тысяч композиций разных стилей: от классики до современной электронной музыки и рока.

При этом создание музыки таким образом происходит в несколько этапов. Сначала модель CLaMP обрабатывает запрос пользователя и конвертирует его в понятный для генератора мелодий язык. Затем в SymFormer генерируется несколько вариантов мультидорожечного трека, из которых нейросеть выбирает наиболее удачные варианты по стилю и композиции. На последнем этапе формируется аудиофайл и передаётся пользователю.

Заглавное изображение сгенерировано нейросетью Kandinsky 3.0 по запросу «музыка, созданная нейросетью».

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
94f9a18e-8594-43dd-890b-205e601820f3-изображение-0dfa93bdf-5006-46c1-b1c1-71d7f57fb82a-изображение-1ccfc5dad-7936-4744-98c4-43a01a6e2629-изображение-2

GigaChat Max: коротко о главном

Рассекречен дизайн iPhone 17 Air

Полная версия 
91d82474-adf9-484f-8829-4d9d837b4ae5-изображение-08788bc05-fa3b-4899-a52b-3c637dfd8a58-изображение-1eb4ae708-1687-472b-ac74-a8d24c49b0e2-изображение-2

GigaChat Max: коротко о главном

Идеальная рабочая среда: 5 аспектов, которые действительно важны

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 315
X5 Tech
Газпромбанк
МТС
Т-Банк
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131