Компания Meta (признана в России экстремистской организацией) показала широкой общественности свою музыкальную большую языковую модель — MusicGen, разработанную внутренней командой Audiocraft.
С помощью текстовых подсказок ИИ может создавать треки длительностью до 12 секунд. При этом отмечается, что для тренировки нейросети использовалась лицензионная музыка. Из-за чего вскоре она может попасть под пристальное внимание защитников авторских прав.
Отмечается, что модель обучали на 20 тысячах часов музыки — это 10 тысяч лицензированных песен, а также 390 тысяч инструментальных композиций из медиабиблиотек ShutterStock и Pond5.
Она может генерировать фрагменты как по описанию, так и с учётом звучания уже существующих песен. Попробовать MusicGen можно бесплатно на платформе Hugging Face.
Репозиторий проекта также доступен на GitHub. Пока там размещены только предобученные модели, которые можно запустить на видеокартах с 16 ГБ видеопамяти.
Читать первым в Telegram-канале «Код Дурова»