Голосовой помощник научили распознавать беззвучные команды

Игорь Савкин

22 октября, 20181 минута на чтение

Читать первым в Telegram-канале

Разработчики из Университета Цинхуа разработали голосовой помощник для смартфонов, который распознаёт команды по движениям губ пользователя. Эта технология может применяться в общественных местах без риска помешать другим.

Юаньчунь Ши (Yuanchun Shi) с коллегами представили на конференции UIST 2018 статью, в которой описали технологию распознавания движений губ и перевода их в текст. Такой голосовой помощник использует фронтальную камеру и свёрточную нейросеть. Алгоритм отслеживает 20 контрольных точек, которые достаточно точно описывают форму губ, а также определяет насколько открыт рот пользователя. Это позволяет распознать начало и конец команды. Второй алгоритм расшифровывает данные. При этом пока все вычисления происходят отдельно на мощном ПК.

Для распознавания используется ограниченный набор команд — всего 44, которые относятся как к отдельным приложениям, так и к конкретным функциям, вроде включения и выключения Wi-Fi. Также поддерживаются и общесистемные задачи, вроде ответа на сообщение или выделения текста.

Разработчики утверждают, что средняя точность распознавания составила 95,5 % по результатам обучения на речи 21 человека. Тесты проводились в метро Пекина. В результате оказалось, что такой метод считается пользователями более комфортным.

Пока что разработчики не уточняют, когда новое приложение появится в релизе. Однако если для распознавания пока нужен мощный компьютер, это произойдёт нескоро. Либо же система будет требовать постоянного подключения к Сети.

Источник: tproger.ru

Данная страница содержит «вставки» с других сайтов, скрипты которых могут собирать ваши личные данные для аналитики и своих внутренних потребностей. Редакция рекомендует использовать браузеры с блокировкой трекеров для просмотра таких страниц. Подробнее →

Подписывайтесь на Telegram-канал

@D_CODE

Реклама. ИП Даллакян Г.А. 2VtzqvPHPsd

[Приватность][реклама на kod.ru]

Подписывайтесь на Telegram-канал

@D_CODE

Реклама. ИП Даллакян Г.А. 2VtzqvPHPsd

[Приватность][реклама на kod.ru]

22 октября, 2018

Голосовой помощник научили распознавать беззвучные команды

Картина дня

«ИИ становится похож на Гомера Симпсона»: в чём его главная проблема? Репортаж с Data Fusion 2024

Полная расшифровка интервью Павла Дурова Такеру Карлсону

«ИИ становится похож на Гомера Симпсона»: в чём его главная проблема? Репортаж с Data Fusion 2024

Обзор Honor Magic 6 Pro: сила и мощь, но не всё так идеально

Пять фишек телевизора Sber MiniLED: чем интересен этот флагман

Полная расшифровка интервью Павла Дурова Такеру Карлсону

«ИИ становится похож на Гомера Симпсона»: в чём его главная проблема? Репортаж с Data Fusion 2024

«ИИ становится похож на Гомера Симпсона»: в чём его главная проблема? Репортаж с Data Fusion 2024

Роскомнадзор планирует выявлять мошеннические интернет-звонки

Юристы OpenAI намерены обжаловать иск Илона Маска

Wildberries обяжет проходить верификацию через «Госуслуги» для зарубежных заказов

Apple прекратила производство аксессуаров из материала FineWoven

Карьера

Пусть сессия боится нас: в билайне знают, как покорять зачеты

Реальные истории реальных людей: что объединяет сотрудников билайна

Пусть сессия боится нас: в билайне знают, как покорять зачеты

С нуля до Big Data: история дата-аналитика в билайне

Как эффективно прожить последние годы в универе: юные билайновцы рекомендуют

Реальные истории реальных людей: что объединяет сотрудников билайна

Пусть сессия боится нас: в билайне знают, как покорять зачеты

Пусть сессия боится нас: в билайне знают, как покорять зачеты

Яндекс Практикум ищет автора на курс «Архитектура ПО» (удалёнка, парт-тайм)

Яндекс Практикум ищет автора на курс «Системный администратор» (удалёнка, парт-тайм)

Яндекс Практикум ищет наставника на курс «DevOps» (удалёнка, парт-тайм)

Яндекс Практикум ищет наставника на курс «Системный администратор» (удалёнка, парт-тайм)

Газпромбанк запускает GPB.Level Up: Data Science

Блоги 206

Голосовой помощник научили распознавать беззвучные команды

Картина дня

Свежие материалы

«ИИ становится похож на Гомера Симпсона»: в чём его главная проблема? Репортаж с Data Fusion 2024

Полная расшифровка интервью Павла Дурова Такеру Карлсону

«ИИ становится похож на Гомера Симпсона»: в чём его главная проблема? Репортаж с Data Fusion 2024

Обзор Honor Magic 6 Pro: сила и мощь, но не всё так идеально

Пять фишек телевизора Sber MiniLED: чем интересен этот флагман

Полная расшифровка интервью Павла Дурова Такеру Карлсону

«ИИ становится похож на Гомера Симпсона»: в чём его главная проблема? Репортаж с Data Fusion 2024

«ИИ становится похож на Гомера Симпсона»: в чём его главная проблема? Репортаж с Data Fusion 2024

Свежие новости

Роскомнадзор планирует выявлять мошеннические интернет-звонки

Юристы OpenAI намерены обжаловать иск Илона Маска

Wildberries обяжет проходить верификацию через «Госуслуги» для зарубежных заказов

Apple прекратила производство аксессуаров из материала FineWoven

Карьера

Свежие материалы

Пусть сессия боится нас: в билайне знают, как покорять зачеты

Реальные истории реальных людей: что объединяет сотрудников билайна

Пусть сессия боится нас: в билайне знают, как покорять зачеты

С нуля до Big Data: история дата-аналитика в билайне

Как эффективно прожить последние годы в универе: юные билайновцы рекомендуют

Реальные истории реальных людей: что объединяет сотрудников билайна

Пусть сессия боится нас: в билайне знают, как покорять зачеты

Пусть сессия боится нас: в билайне знают, как покорять зачеты

Свежие вакансии

Яндекс Практикум ищет автора на курс «Архитектура ПО» (удалёнка, парт-тайм)

Яндекс Практикум ищет автора на курс «Системный администратор» (удалёнка, парт-тайм)

Яндекс Практикум ищет наставника на курс «DevOps» (удалёнка, парт-тайм)

Яндекс Практикум ищет наставника на курс «Системный администратор» (удалёнка, парт-тайм)

Газпромбанк запускает GPB.Level Up: Data Science

Блоги 206