5 июля 2025

eur = 93.01 -0.12 (-0.13 %)

btc = 108 028.00$ - 816.08 (-0.75 %)

eth = 2 513.58$ -38.00 (-1.49 %)

ton = 2.74$ -0.09 (-3.03 %)

usd = 78.84 0.05 (0.07 %)

eur = 93.01 -0.12 (-0.13 %)

btc = 108 028.00$ - 816.08 (-0.75 %)

Нейросеть научили рисовать лицо человека по его голосу

1 минута на чтение
Нейросеть научили рисовать лицо человека по его голосу

Американские ученые из Массачусетского технологического института представили нейросеть Speech2Face, которая может воссоздавать по спектрограмме речи человека примерное изображение его лица. Описание работы искусственного интеллекта опубликовано в arXiv.org.

Нейросеть научили рисовать лицо человека по его голосу

Нейросеть Speech2Face обучена на нескольких миллионах видео с голосом пользователей. Каждое видео разделено на дорожку аудио и видео. Сам алгоритм разделен на несколько частей: одна из них использует все уникальные особенности лица из видеодорожки для создания снимка лица человека в анфас, другая пытается воссоздать из аудиодорожки ролика спектрограмму речи и смотрит, как выглядит анфас человека, который говорит на оригинальном видео.

В методологии нейросети изображение человека и голос делятся на три демографических показателя — пол, возраст и расу.

Нейросеть научили рисовать лицо человека по его голосу

Во время тестирования ученым пока не до конца удалось научить нейросеть восстановить внешность человека на основе голоса. Искусственный интеллект всегда может определить пол, а также чаще всего угадывает людей с азиатской и европеоидной внешностью. Однако пока Speech2Face не может точно определить возраст даже с разницей в десять лет.

Ученые отметили, что главное в работе Speech2Face — все же не создание точной копии изображения человека по его голосу, а выделение из него некоторых точных параметров. При этом, естественно, по голосу человека невозможно понять, какой у него формы нос или находится ли на лице объекта крупная родинка.

Источник: hightech.fm

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
55a36004-2499-4525-b9c9-49bd7b11eff2-изображение-0de994f7a-c143-4170-b352-00ce21ff0b2e-изображение-1

GigaChat Max: коротко о главном

Tesla запустила первую автономную зарядную станцию на солнечных батареях

Полная версия 
2f70d456-4e83-4017-824b-73ecace9a69f-изображение-0

GigaChat Max: коротко о главном

Издатели в ЕС подали жалобы на Google из-за ИИ-сводок в поиске

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 371
Газпромбанк
OTP Bank
Т-Банк
X5 Tech
билайн
Сбер
МТС
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы