Исследователи из Института интеллектуальных вычислений Alibaba разработали систему искусственного интеллекта EMO (Emote Portrait Alive), которая анимирует статическое изображение человека, заставляя его реалистично говорить или петь.
Alibaba создала официальную страницу для EMO, на которой полностью демонстрирует, как ИИ справляется с этой задачей, и, кроме того, приводит примеры различных применений этого инструмента.
Система изображает реалистичную мимику и движения головы, точно соответствующие эмоциональным оттенкам звукового ряда, на основе которого генерируется анимация.
Авторы проекта утверждают, что EMO превосходит существующие методы по показателям качества видео, сохранения идентичности и выразительности. Исследователи опросили фокус-группу, и та показала, что созданные EMO видеоролики более естественны и эмоциональны, чем произведения других систем.
Читать первым в Telegram-канале «Код Дурова»