15 сентября 2025

eur = 99.33 -0.41 (-0.41 %)

btc = 114 670.00$ - 967.42 (-0.84 %)

eth = 4 512.34$ - 122.82 (-2.65 %)

ton = 3.14$ -0.03 (-0.89 %)

usd = 84.38 -1.28 (-1.50 %)

eur = 99.33 -0.41 (-0.41 %)

btc = 114 670.00$ - 967.42 (-0.84 %)

Голосовой помощник научили распознавать беззвучные команды

1 минута на чтение
Голосовой помощник научили распознавать беззвучные команды

Разработчики из Университета Цинхуа разработали голосовой помощник для смартфонов, который распознаёт команды по движениям губ пользователя. Эта технология может применяться в общественных местах без риска помешать другим.

Юаньчунь Ши (Yuanchun Shi) с коллегами представили на конференции UIST 2018 статью, в которой описали технологию распознавания движений губ и перевода их в текст. Такой голосовой помощник использует фронтальную камеру и свёрточную нейросеть. Алгоритм отслеживает 20 контрольных точек, которые достаточно точно описывают форму губ, а также определяет насколько открыт рот пользователя. Это позволяет распознать начало и конец команды. Второй алгоритм расшифровывает данные. При этом пока все вычисления происходят отдельно на мощном ПК.

Для распознавания используется ограниченный набор команд — всего 44, которые относятся как к отдельным приложениям, так и к конкретным функциям, вроде включения и выключения Wi-Fi. Также поддерживаются и общесистемные задачи, вроде ответа на сообщение или выделения текста.

Разработчики утверждают, что средняя точность распознавания составила 95,5 % по результатам обучения на речи 21 человека. Тесты проводились в метро Пекина. В результате оказалось, что такой метод считается пользователями более комфортным.

Пока что разработчики не уточняют, когда новое приложение появится в релизе. Однако если для распознавания пока нужен мощный компьютер, это произойдёт нескоро. Либо же система будет требовать постоянного подключения к Сети.

Источник: tproger.ru

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от ГигаЧат 
1-bg-изображение-0
img-content-1-изображение-0

ГигаЧат: коротко о главном

Как изменился Код Дурова вместе с ГигаЧат?

Узнай о всех возможностях в FAQ-статье 
Spotify расширила возможности бесплатных пользователей

ГигаЧат: коротко о главном

Spotify расширила возможности бесплатных пользователей

Полная версия 
«Магнит» запустил тестирование цифрового подтверждения возраста через мессенджер MAX«Магнит» запустил тестирование цифрового подтверждения возраста через мессенджер MAX«Магнит» запустил тестирование цифрового подтверждения возраста через мессенджер MAX

ГигаЧат: коротко о главном

«Магнит» запустил тестирование цифрового подтверждения возраста через мессенджер MAX

Полная версия 

Реализовано через ГигаЧат 

Сейчас читают
Редакция рекомендует
Карьера
Блоги 417
Газпромбанк
OTP Bank
Т-Банк
X5 Tech
билайн
МТС
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы