В Санкт-Петербурге представили технологию, основанную на нейросетях, которая способна превратить написанный текст в плавную и выразительную речь. Технологией синтеза речи занималась группа компаний «Центр речевых технологий». Об этом сообщил ТАСС.

Представленное решение — это третье поколение системы синтеза речи. Высококачественный аудиосигнал генерируют сложные нейросетевые модели. Разработчики заявляют, что результатом работы этих алгоритмов является самый реалистичный синтез русскоязычной речи.
В состав платформы входит модуль предсказания ударений в словах, которых ещё нет в базовом словаре. Кроме того, предусмотрено автоматическое исправление типичных орфографических ошибок. Благодаря глубокому лингвистическому анализу текста произношение будет соответствовать нормам языка даже в сложных случаях.
Ещё одно достоинство платформы заключается в том, что ей не требуются дорогостоящие серверы, оснащённые GPU-ускорителями. Использовать технологию можно двумя способами — через облачный сервис или встроив в собственное решение. Опробовать технологию можно здесь.
Читать первым в Telegram-канале «Код Дурова»