Компания Meta (признана экстремистской организацией) представила EnCodec — кодек на основе искусственного интеллекта, который, по заявлениям компании, сжимает аудио в 10 раз относительно MP3 без потери качества.
Encodec может сжать поток данных MP3 со скоростью 64 Кбит/с в 6 Кбит/с при сохранении того же качества. По словам Meta, Encodec может кодировать и декодировать аудиоданные в режиме реального времени на одном ядре ЦП без ущерба для процесса и с применением возможных улучшений.
По заявлению Meta, этот метод может значительно улучшить качество звука при низкоскоростных соединениях, например, при телефонных звонках с нестабильным соединением. Это также работает и для музыки.
Компания описывает EnCodec как трёхступенчатую систему. В этой системе сначала идёт преобразование несжатых данных в специальный формат с более низким битрейтом. Далее алгоритм сжимает полученный формат до необходимого размера, при этом сохраняя наиболее важную информацию, которая позже будет использована для восстановления исходного сигнала. И, наконец, кодек преобразует сжатые данные обратно в аудио в режиме реального времени, используя нейронную сеть.
Отмечается, что использование нейронной сети для сжатия и распаковки звука далеко не ново. Однако исследователи Meta утверждают, что они являются первыми, кто применил технологию к стереозвуку с частотой дискретизации 48 кГц – под эту категорию попадают практически все музыкальные CD и большинство музыки в интернете.
Читать первым в Telegram-канале «Код Дурова»