13 февраля 2025

eur = 99.20 -1.30 (-1.30 %)

btc = 96 541.00$ 707.33 (0.74 %)

eth = 2 716.28$ 108.32 (4.15 %)

ton = 3.73$ 0.01 (0.21 %)

usd = 95.80 -0.98 (-1.01 %)

eur = 99.20 -1.30 (-1.30 %)

btc = 96 541.00$ 707.33 (0.74 %)

Форум

Искусственный интеллект научили распознавать акценты речи

1 минута на чтение
Искусственный интеллект научили распознавать акценты речи

Команда учёных из Cisco, Московского физико-технического института и Высшей школы экономики использовала машинное обучение, чтобы разработать улучшенную модель для распознавания речи. Об этом исследователи подробно написали в статье.

speech-rec-770-270

Раньше учёные вручную выявляли фонологические сходства между единицами языка в общем американском английском и словаре произношения университета Карнеги — Меллона. Для создания улучшенной модели они пошли нестандартным путём и позволили ей автоматически сформировать правила: сделать необходимые замены, подстановки и удалить лишнее. Затем она сопоставила получившийся уникальный список с набором примеров из архива речевых акцентов университета Джорджа Мейсона.

На основе полученных примеров команда создала фонетический набор данных, по которому обучалась нейронная сеть, часто используемая для распознавания речи. Точность определения слов, после преодоления отметки в 800 000 примеров, составила 59 %.

Исследование назвали предварительным по причине меньшего количества звуков в словаре университета Карнеги — Меллона. Несмотря на фонетические совпадения в 13 из 20 случаев сравнения словарей, учёным удалось увеличить массив данных со 103 тысяч фонетических транскрипций с одним акцентом до 1 миллиона образцов с несколькими акцентами.

Источник: tproger.ru

Подписывайтесь на «Код Дурова» в Telegram и во «ВКонтакте», чтобы всегда быть в курсе интересных новостей!

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
937fa170-438f-4821-9b8d-7bf6508659d8-изображение-0

GigaChat Max: коротко о главном

OpenAI анонсировала GPT-5 и поделилась подробностями о GPT-4.5

Полная версия 
89618b91-5f5c-4c9b-a50d-c54219c93e01-изображение-0e028eb82-9017-4349-8d46-9d8f0ebb7d63-изображение-1

GigaChat Max: коротко о главном

Яндекс обновил главную страницу поиска, изменив дизайн и расположение логотипа

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 314
Газпромбанк
X5 Tech
МТС
Т-Банк
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131