11 декабря 2024

eur = 106.20 1.10 (1.05 %)

btc = 98 162.00$ 471.35 (0.48 %)

eth = 3 716.50$ 11.44 (0.31 %)

ton = 6.17$ 0.38 (6.65 %)

usd = 100.03 0.66 (0.66 %)

eur = 106.20 1.10 (1.05 %)

btc = 98 162.00$ 471.35 (0.48 %)

Форум

Yandex Cloud разработала нейросеть-«эмпата», которая распознаёт эмоции человека по голосу

1 минута на чтение
Yandex Cloud разработала нейросеть-«эмпата», которая распознаёт эмоции человека по голосу

Yandex Cloud представила нейросеть, способную по голосу распознавать эмоции, негатив, неформальные высказывания и нецензурную лексику, а также пол спикера и его фразы в диалоге.

С её помощью бизнес сможет создавать голосовых помощников и виртуальных операторов кол-центров, сообщили в компании.

Нейросеть-эмпат разработана на базе технологии распознавания речи Yandex SpeechKit. С её помощью компании смогут создавать голосовых помощников и виртуальных операторов кол-центров, которые умеют понимать человеческие эмоции. Это позволит бизнесу улучшить качество аналитики телефонных разговоров, а также лучше адаптировать работу кол-центров под каждого клиента и оперативно реагировать на нештатные ситуации во время диалога, – говорится в сообщении.

Алгоритм может определять эмоции не только по содержанию речи спикера, но и по голосу – по скорости речи, высоте,тембру и другим параметрам. Нейросеть также определяет пол участников разговора и поддерживает технологию speaker labeling – она отмечает, кому принадлежит та или иная реплика.

Это позволяет полноценно работать с одноканальными звуковыми дорожками: например, при записи с диктофона или при технологических ограничениях виртуальной АТС. Кроме того, ML-модель расширяет возможности оффлайн-аналитики: данные от нейросети помогут понять, какие именно темы и формулировки от оператора вызывают негатив у клиента, и позволит оптимизировать сценарии коммуникации.

Вскоре новая модель заработает в сервисе речевой аналитики SpeechSense, который включает в себя технологии Yandex SpeechKit и интегрирован с генеративной нейросетью YandexGPT. Взаимодействие нескольких ML-моделей позволит распознать более сложные эмоции спикера – например, неуверенность или сарказм. Также нейросети смогут оценить, насколько оператор действительно погрузился в проблему клиента, пытался ли помочь решению или старался как можно быстрее завершить разговор.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
3e71e041-6300-43ea-85c9-90df3c814a3b-изображение-0

GigaChat Max: коротко о главном

Т-банк выпустил в открытый доступ большую языковую модель T-Pro на 32 млрд параметров

Полная версия 
8ff03afc-e549-4a8d-b898-1dd863e0d08e-изображение-02130305e-22d4-4ab4-bda5-219ea272db50-изображение-1

GigaChat Max: коротко о главном

Microsoft научила «Проводник» научился восстанавливать закрытые окна и вкладки после перезагрузки Windows 11

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 300
Газпромбанк
МТС
Т-Банк
X5 Tech
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131