9 февраля 2025

eur = 101.22 0.55 (0.55 %)

btc = 97 062.00$ 1 200.84 (1.25 %)

eth = 2 666.64$ 62.48 (2.40 %)

ton = 3.82$ 0.15 (3.98 %)

usd = 97.28 0.37 (0.38 %)

eur = 101.22 0.55 (0.55 %)

btc = 97 062.00$ 1 200.84 (1.25 %)

Форум

Нейросеть научили рисовать лицо человека по его голосу

1 минута на чтение
Нейросеть научили рисовать лицо человека по его голосу

Американские ученые из Массачусетского технологического института представили нейросеть Speech2Face, которая может воссоздавать по спектрограмме речи человека примерное изображение его лица. Описание работы искусственного интеллекта опубликовано в arXiv.org.

Нейросеть Speech2Face обучена на нескольких миллионах видео с голосом пользователей. Каждое видео разделено на дорожку аудио и видео. Сам алгоритм разделен на несколько частей: одна из них использует все уникальные особенности лица из видеодорожки для создания снимка лица человека в анфас, другая пытается воссоздать из аудиодорожки ролика спектрограмму речи и смотрит, как выглядит анфас человека, который говорит на оригинальном видео.

В методологии нейросети изображение человека и голос делятся на три демографических показателя — пол, возраст и расу.

Во время тестирования ученым пока не до конца удалось научить нейросеть восстановить внешность человека на основе голоса. Искусственный интеллект всегда может определить пол, а также чаще всего угадывает людей с азиатской и европеоидной внешностью. Однако пока Speech2Face не может точно определить возраст даже с разницей в десять лет.

Ученые отметили, что главное в работе Speech2Face — все же не создание точной копии изображения человека по его голосу, а выделение из него некоторых точных параметров. При этом, естественно, по голосу человека невозможно понять, какой у него формы нос или находится ли на лице объекта крупная родинка.

Источник: hightech.fm

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
1755c1ad-04fe-4dc2-862d-993015924632-изображение-0

GigaChat Max: коротко о главном

Илон Маск заявил, что не намерен приобретать американский бизнес TikTok

Полная версия 
a62e8315-d3d8-4a47-9fda-4cfd0bc044a2-изображение-054d10a0c-23ac-40a8-aa6e-836872d311e6-изображение-1

GigaChat Max: коротко о главном

Американские эксперты призывают удалить чат-бот DeepSeek с iPhone

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 312
Газпромбанк
X5 Tech
МТС
Т-Банк
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131