22 октября 2024

eur = 104.86 -0.90 (-0.85 %)

btc = 67 319.00$ -1 597.08 (-2.32 %)

eth = 2 642.50$ -94.17 (-3.44 %)

ton = 5.22$ -0.12 (-2.17 %)

usd = 96.42 -0.73 (-0.75 %)

eur = 104.86 -0.90 (-0.85 %)

btc = 67 319.00$ -1 597.08 (-2.32 %)

Форум

Яндекс представил технологию автоматического перевода и озвучивания англоязычных видео

1 минута на чтение
Яндекс представил технологию автоматического перевода и озвучивания англоязычных видео

Читать первым в Telegram-канале «Код Дурова»

Яндекс показал свой прототип машинного перевода видео. Технология объединит в себе машинный перевод, технологии биометрии, распознавания и синтеза речи. Благодаря ей пользователи Яндекс.Браузера смогут смотреть ролики на иностранном языке с закадровым переводом. Увидеть, как работает прототип, можно уже сейчас.

В интернете очень много полезного контента, который недоступен людям из-за языкового барьера. И мы близки к тому, чтобы окончательно стереть все границы. Яндекс.Браузер давно умеет переводить тексты, в этом году стал переводить изображения, перевод видео — следующий этап. Это большая сложная задача, которую никто в мире еще не решил. Мы тоже в начале пути, но у нас уже есть прототип и понимание, куда двигаться дальше, — говорит руководитель направления обработки естественного языка в Яндексе Дэвид Талбот.

Прототип работает только с роликами на английском языке. Как отмечают разработчики технологии, уже её опробовали на видеозаписях на разные темы. Среди них есть видео про изменение климата, машинное обучение, историю Плутона и другие не менее интересные вещи. Посмотреть видео с закадровым переводом пользователи десктопного Яндекс.Браузера могут здесь.

Над созданием прототипа работало несколько команд. Сейчас в нём применяются технология синтеза речи, разработки Яндекс.Переводчика и биометрия. Она позволяет определить пол говорящего и подобрать соответствующий голос. А чтобы закадровый голос совпадал с картинкой, переводчик делает паузы, где-то замедляет, а где-то ускоряет речь. Дело в том, что в оригинале и переводе реплики часто не совпадают по длине, поэтому за темпом речи следит специальный алгоритм. Работа над прототипом продолжается. Уже скоро пользователи смогут сами выбирать, какие ролики переводить с помощью новой технологии.

Материал отредактирован (20.07.21)

Сейчас читают

Картина дня

19 октября, 2024
19 октября, 20244 минуты на чтение
Фото Влад Войтенко
Влад Войтенко
4 минуты на чтение
[ Новости ]
[ Статьи ]
Личный опыт работы
Блоги 283