Читать первым в Telegram-канале «Код Дурова»
Развиваемая «Сбером» ИИ-платформа Visper, которая позволяет генерировать видеоролики с фотореалистичными и анимационными персонажами без специальных навыков, получила ряд новых возможностей. Об этом «Коду Дурова» рассказали в SberDevices.
Одно из ключевых новшеств — это генерация речи не только на русском, но и на английском языке. Достаточно лишь ввести текст, и аватар зачитает его с корректным произношением. То есть, если раньше пользователи Visper могли создать ролик понятный 200 млн человек, говорящих на русском языке, то теперь потенциальная аудитория увеличилась в более чем 8 раз — за счет 1,5 млрд человек, владеющих английским, отметили в компании.
По данным SberDevices, на сегодняшний день платформой пользуются 17 тысяч человек.
Сейчас Visper предлагает шесть аватаров. Это фотореалистичные Елена, Пётр и Ева, а также анимационные Матильда, Ви и Кира. Для каждого из них доступен свой набор образов и костюмов, а также 4 женских и 2 мужских голоса для русской озвучки и по 5 женских и мужских голосов для английской.
Помимо текста, за основу для ролика можно взять любую презентацию, а также анимировать собственную фотографию и вставить её в ролик.
Чтобы сделать чтение текста ещё более реалистичным, в редакторе доступна функция разметки текста, с помощью которой речь аватара можно сделать более эмоциональной, изменить ее темп, добавить паузы и ударения. Для этого достаточно добавить в текст соответствующие метки.
Кроме того, в Visper можно загрузить собственную аудиозапись, после чего сервис синхронизирует мимику виртуального персонажа, чтобы она выглядела максимально естественной. При этом из записи будут автоматически удалены все посторонние шумы, если таковые имеются.
Ещё одна новая функция — это возможность вставить фоновую музыку, которая будет проигрываться на протяжении всего ролика на громкости 10% от голоса персонажа. Согласно задумке, опция сделает видео более живым и динамичным, а также задаст нужное настроение. На платформе уже доступны три трека, созданные при помощи нейросетей глубокого обучения командой SberDevices.
В «Сбере» отмечают, что Visper будет полезен, например, контент-мейкерам и разработчикам инфопродуктов, так как позволяет создавать качественные материалы и экспериментировать с форматами без дорогостоящих и долгих съёмок. Кроме того, платформа способна оживить текстовый контент с помощью видео, оперативно предоставить визуальный материал для динамически меняющегося контента, например, для новостей и анонсов, а также персонализировать коммуникацию с помощью генерации по параметризованным видео с помощью API.
Бесплатный тариф Visper позволяет создавать 2 минуты видео в месяц, для более серьёзных задач предусмотрена гибкая система тарифов, позволяющая оплачивать сервис как поминутно, так и в рамках подписки. Для бизнеса же доступны кастомные решения под собственны требования.
Узнать подробнее о платформе и попробовать сгенерировать ролик самому можно по этой ссылке.