16 сентября 2025

eur = 97.45 -1.88 (-1.89 %)

btc = 115 188.00$ - 284.02 (-0.25 %)

eth = 4 529.60$ -96.90 (-2.09 %)

ton = 3.15$ -0.06 (-1.72 %)

usd = 83.07 -1.31 (-1.55 %)

eur = 97.45 -1.88 (-1.89 %)

btc = 115 188.00$ - 284.02 (-0.25 %)

Яндекс добавил в SpeechKit поддержку узбекского языка

1 минута на чтение
Яндекс добавил в SpeechKit поддержку узбекского языка

Облачная платформа Yandex Cloud разработала нейросети, которые могут распознавать речь и воспроизводить её на узбекском языке.

Компании как в России, так и в Узбекистане уже могут использовать новый язык в сервисе Yandex SpeechKit для создания голосовых помощников, автоматизации колл-центров и речевой аналитики.

Модели синтеза речи обучались на предзаписи голоса реального диктора. При этом они умеют синтезировать речь не только из текста, но и из его фонемной записи, в которой указаны все особенности звуков в словах. Это позволит клиентам корректировать в синтезе произношение отдельных слов – сложные фамилии, названия товаров, заимствованные выражения. Для этого им нужно будет указать в тексте фонемный разбор нужного слова с помощью специального синтаксиса.

Так же как и для синтеза речи, для распознавания нейросети учатся на примерах. Чтобы их обучить, специалисты Yandex Cloud собрали датасет с тысячами часов аудио и их расшифровками, в том числе короткие и длинные фразы, а также имена, адреса, даты и числа.

Нейросети для синтеза и распознавания узбекского работают с латинским алфавитом, который используется в Узбекистане уже больше 20 лет. При этом алгоритмам пришлось выучить и некоторые звуковые особенности букв. Например, буква «X» обозначает в алфавите твёрдый [х], а в иностранных словах может произноситься как [кс].

В Узбекистане сейчас активно развиваются сценарии, связанные с искусственным интеллектом, в частности с речевыми технологиями. По оценке одного из наших партнёров, объем рынка речевых технологий в Узбекистане может достигать до 395 миллионов минут обработанной речи в год. Появление нового шестнадцатого языка в Yandex SpeechKit – большой шаг для создания новых диалоговых сценариев как для узбекских, так и для российских компаний, – рассказал Григорий Атрепьев, директор по продуктам в Yandex Cloud.

Модели доступны на сайте и настраиваются стандартными средствами в API. Синтез и распознавание узбекского языка с помощью Yandex SpeechKit уже начал использовать ряд компаний, в том числе, например, Kolesa Group. Также технологию уже тестируют и интегрируют в свои решения компании-партнеры, в том числе TargetAI, JustAI, Unistar Digital и Tomoru.

Материал обновлен|

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от ГигаЧат 
1-bg-изображение-0
img-content-1-изображение-0

ГигаЧат: коротко о главном

Как изменился Код Дурова вместе с ГигаЧат?

Узнай о всех возможностях в FAQ-статье 
К банкротству Fplus подключились банки «Санкт-Петербург» и ББР

ГигаЧат: коротко о главном

К банкротству Fplus подключились банки «Санкт-Петербург» и ББР

Полная версия 
OpenAI выпустила ИИ-агента GPT-5-Codex для программистовOpenAI выпустила ИИ-агента GPT-5-Codex для программистов

ГигаЧат: коротко о главном

OpenAI выпустила ИИ-агента GPT-5-Codex для программистов

Полная версия 

Реализовано через ГигаЧат 

Сейчас читают
Редакция рекомендует
Карьера
Блоги 417
Газпромбанк
OTP Bank
Т-Банк
X5 Tech
билайн
МТС
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы