30 марта 2026

eur = 93.42 -1.58 (-1.66 %)

btc = 66 453.00$ - 535.69 (-0.80 %)

eth = 1 992.36$ -34.44 (-1.70 %)

ton = 1.22$ -0.03 (-2.56 %)

usd = 81.14 -0.99 (-1.20 %)

eur = 93.42 -1.58 (-1.66 %)

btc = 66 453.00$ - 535.69 (-0.80 %)

Голосовой помощник научили распознавать беззвучные команды

1 минута на чтение
Голосовой помощник научили распознавать беззвучные команды

Читайте в Telegram

|

Разработчики из Университета Цинхуа разработали голосовой помощник для смартфонов, который распознаёт команды по движениям губ пользователя. Эта технология может применяться в общественных местах без риска помешать другим.

Юаньчунь Ши (Yuanchun Shi) с коллегами представили на конференции UIST 2018 статью, в которой описали технологию распознавания движений губ и перевода их в текст. Такой голосовой помощник использует фронтальную камеру и свёрточную нейросеть. Алгоритм отслеживает 20 контрольных точек, которые достаточно точно описывают форму губ, а также определяет насколько открыт рот пользователя. Это позволяет распознать начало и конец команды. Второй алгоритм расшифровывает данные. При этом пока все вычисления происходят отдельно на мощном ПК.

Для распознавания используется ограниченный набор команд — всего 44, которые относятся как к отдельным приложениям, так и к конкретным функциям, вроде включения и выключения Wi-Fi. Также поддерживаются и общесистемные задачи, вроде ответа на сообщение или выделения текста.

Разработчики утверждают, что средняя точность распознавания составила 95,5 % по результатам обучения на речи 21 человека. Тесты проводились в метро Пекина. В результате оказалось, что такой метод считается пользователями более комфортным.

Пока что разработчики не уточняют, когда новое приложение появится в релизе. Однако если для распознавания пока нужен мощный компьютер, это произойдёт нескоро. Либо же система будет требовать постоянного подключения к Сети.

Источник: tproger.ru

Блоги 494
билайн
Слетать.ру
ВКонтакте
OTP Bank
Т-Банк
Газпромбанк
МТС
X5 Tech
Сбер
Яндекс Практикум