16 сентября 2025

eur = 97.45 -1.88 (-1.89 %)

btc = 115 099.00$ 422.35 (0.37 %)

eth = 4 439.22$ -73.12 (-1.62 %)

ton = 3.16$ 0.02 (0.71 %)

usd = 83.07 -1.31 (-1.55 %)

eur = 97.45 -1.88 (-1.89 %)

btc = 115 099.00$ 422.35 (0.37 %)

Яндекс представил новую версию машинного перевода

2 минуты на чтение
Яндекс представил новую версию машинного перевода

Большая языковая модель YandexGPT подготовила эталонные примеры текстов, на которых обучили нейросеть в Яндекс Переводчике, сообщили в пресс-службе Яндекса.

Это позволило сервису точнее понимать контекст, распознавать фразеологизмы и ориентироваться в профессиональной лексике. Он лучше справляется с длинными и сложными текстами, лучше определяет взаимосвязи внутри предложений и между ними.

Также выросло качество перевода статей узконаправленной тематики:

Яндекс представил новую версию машинного перевода
Изображение: Яндекс
Например, сервис теперь поймёт по контексту, что речь идёт о языке программирования или фондовом индексе, и оставит их названия без перевода.

Обновлённая технология используется для перевода текстов с английского на русский язык в Яндекс Переводчике, Поиске, а также в переводе видео в Браузере.

  • Технологию машинного перевода Яндекс мспользует на основе нейросетей с 2018 года. Нейросеть в Переводчике обучалась только на парах текстов — оригиналах и их переводе на другой язык.
  • Так она училась видеть взаимосвязи между ними и подражать им.
  • Нейросеть, работающая в сервисе, легковесная: это позволяет ей справляться с большим количеством пользовательских запросов в реальном времени.
Большая языковая модель YandexGPT способна генерировать сложные, лексически и стилистически разнообразные тексты, в том числе со специфической терминологией. Поэтому компания использовала её потенциал для создания эталонных примеров, чтобы расширить датасет и повысить его качество. Так нейросеть в Переводчике не утратила скорость своей работы, но стала умнее.

Яндекс заявил, что для генерации эталонных обучающих примеров компания разработала специализированную модель семейства YandexGPT, адаптировав её под задачи перевода:

Яндекс представил новую версию машинного перевода
Изображение: Яндекс
Сначала модель во время этапа pretraining проанализировала множество текстов на английском и русском языках и изучила правила лексики, морфологии и синтаксиса. Следующим этапом шла тонкая настройка языковой модели (supervised finetuning) под задачи перевода. Затем на этапе reinforcement learning AI-тренеры оценивали качество перевода YandexGPT и ранжировали её ответы от лучших к худшим.

Компания утверждает, что работу дообученной нейросети в Переводчике оценивали методом Side by Side (SbS). Асессоры, владеющие русским и английским, сравнивали пары длинных и сложных текстов, переведённых при помощи двух версий технологии, и выбирали лучший вариант:

  • В 57% случаев новая версия справлялась лучше.

Заглавное изображение: Яндекс

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от ГигаЧат 
1-bg-изображение-0
img-content-1-изображение-0

ГигаЧат: коротко о главном

Как изменился Код Дурова вместе с ГигаЧат?

Узнай о всех возможностях в FAQ-статье 
Павел Дуров примет участие в Международном технологическом форуме в КазахстанеПавел Дуров примет участие в Международном технологическом форуме в КазахстанеПавел Дуров примет участие в Международном технологическом форуме в Казахстане

ГигаЧат: коротко о главном

Павел Дуров примет участие в Международном технологическом форуме в Казахстане

Полная версия 
Энтузиаст запустил сайт на чипе от одноразовой электронной сигареты

ГигаЧат: коротко о главном

Энтузиаст запустил сайт на чипе от одноразовой электронной сигареты

Полная версия 

Реализовано через ГигаЧат 

Сейчас читают
Редакция рекомендует
Карьера
Блоги 417
Газпромбанк
OTP Bank
Т-Банк
X5 Tech
билайн
МТС
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы