Читать первым в Telegram-канале «Код Дурова»
Компания известного кинорежиссера Тимура Бекмамбетова Screenlife Technologies в партнерстве с разработчиком цифрового рекрутера «Робот Вера» создали технологию для синтеза голоса знаменитостей.
Проект получил название Vera Voice, и его планируют использовать для озвучки фильмов, сериалов и рекламных роликов, а также для создания голосов для цифровых ассистентов и поздравлений от лица знаменитостей. Для развития проекта Screenlife Technologies и «Стафори» создадут совместное предприятие.
Алгоритм Vera Voice при помощи нейросети анализирует голос человека и воссоздает его цифровую копию с учетом специфического произношения слов, скорости речи, интонаций и тембра.
Для синтеза голоса достаточно нескольких часов аудиоданных, озвученных обладателем голоса и оцифрованный текст, который он зачитывает. Аудиопоток и текст «выгружаются» в несколько нейронных сетей одновременно, одна — генерирует спектрограмму звука (его визуальное изображение), а вторая — непосредственно звук, — прокомментировал разработку сооснователь Stafory Владимир Свешников в разговоре с vc.ru.
Первые проекты с использованием Vera Voice планируется запустить уже в течение месяца. Так, например, уже известно о соглашении с сооснователем студии «Кубик в кубе» Русланом Габидуллиным.
Причем в разработчики алгоритма обещают следить за авторскими правами и появлением голосовых клонов:
Отлавливать подделки и защищать известных людей от несанкционированного копирования их образов — одна из главных задач нашего проекта, — заявил Тимур Бекмамбетов.
В промо-ролике проекта делается акцент в том числе на ответственности ученых и разработчиков при использовании подобных технологий.