Искусственный интеллект научили распознавать акценты речи

Команда учёных из Cisco, Московского физико-технического института и Высшей школы экономики использовала машинное обучение, чтобы разработать улучшенную модель для распознавания речи. Об этом исследователи подробно написали в статье.

speech-rec-770-270

Раньше учёные вручную выявляли фонологические сходства между единицами языка в общем американском английском и словаре произношения университета Карнеги — Меллона. Для создания улучшенной модели они пошли нестандартным путём и позволили ей автоматически сформировать правила: сделать необходимые замены, подстановки и удалить лишнее. Затем она сопоставила получившийся уникальный список с набором примеров из архива речевых акцентов университета Джорджа Мейсона.

На основе полученных примеров команда создала фонетический набор данных, по которому обучалась нейронная сеть, часто используемая для распознавания речи. Точность определения слов, после преодоления отметки в 800 000 примеров, составила 59 %.

Исследование назвали предварительным по причине меньшего количества звуков в словаре университета Карнеги — Меллона. Несмотря на фонетические совпадения в 13 из 20 случаев сравнения словарей, учёным удалось увеличить массив данных со 103 тысяч фонетических транскрипций с одним акцентом до 1 миллиона образцов с несколькими акцентами.

Источник: tproger.ru

Подписывайтесь на «Код Дурова» в Telegram и во «ВКонтакте», чтобы всегда быть в курсе интересных новостей!