26 октября 2025

eur = 94.08 -0.31 (-0.33 %)

btc = 111 622.00$ 636.51 (0.57 %)

eth = 3 953.30$ 17.34 (0.44 %)

ton = 2.15$ -0.02 (-0.84 %)

usd = 80.97 -0.30 (-0.37 %)

eur = 94.08 -0.31 (-0.33 %)

btc = 111 622.00$ 636.51 (0.57 %)

Нейросеть научили рисовать лицо человека по его голосу

1 минута на чтение
Нейросеть научили рисовать лицо человека по его голосу

Американские ученые из Массачусетского технологического института представили нейросеть Speech2Face, которая может воссоздавать по спектрограмме речи человека примерное изображение его лица. Описание работы искусственного интеллекта опубликовано в arXiv.org.

Нейросеть научили рисовать лицо человека по его голосу

Нейросеть Speech2Face обучена на нескольких миллионах видео с голосом пользователей. Каждое видео разделено на дорожку аудио и видео. Сам алгоритм разделен на несколько частей: одна из них использует все уникальные особенности лица из видеодорожки для создания снимка лица человека в анфас, другая пытается воссоздать из аудиодорожки ролика спектрограмму речи и смотрит, как выглядит анфас человека, который говорит на оригинальном видео.

В методологии нейросети изображение человека и голос делятся на три демографических показателя — пол, возраст и расу.

Нейросеть научили рисовать лицо человека по его голосу

Во время тестирования ученым пока не до конца удалось научить нейросеть восстановить внешность человека на основе голоса. Искусственный интеллект всегда может определить пол, а также чаще всего угадывает людей с азиатской и европеоидной внешностью. Однако пока Speech2Face не может точно определить возраст даже с разницей в десять лет.

Ученые отметили, что главное в работе Speech2Face — все же не создание точной копии изображения человека по его голосу, а выделение из него некоторых точных параметров. При этом, естественно, по голосу человека невозможно понять, какой у него формы нос или находится ли на лице объекта крупная родинка.

Источник: hightech.fm

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от ГигаЧат 
1-bg-изображение-0
img-content-1-изображение-0

ГигаЧат: коротко о главном

Как изменился Код Дурова вместе с ГигаЧат?

Узнай о всех возможностях в FAQ-статье 
Nike представила первые в мире кроссовки с электроприводомNike представила первые в мире кроссовки с электроприводомNike представила первые в мире кроссовки с электроприводом

ГигаЧат: коротко о главном

Nike представила первые в мире кроссовки с электроприводом

Полная версия 
Microsoft объявила о запуске ИИ-режима в браузере EdgeMicrosoft объявила о запуске ИИ-режима в браузере Edge

ГигаЧат: коротко о главном

Microsoft объявила о запуске ИИ-режима в браузере Edge

Полная версия 

Реализовано через ГигаЧат 

Сейчас читают
Цифра в деле
Цифра в деле
Смотреть
Реклама. ПАО Сбербанк. erid: 2Vtzqv3u7MN
Карьера
Блоги 436
билайн
OTP Bank
Газпромбанк
МТС
Т-Банк
X5 Tech
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы