27 июня 2026

eur = 87.40 1.63 (1.90 %)

btc = 59 969.00$ 149.52 (0.25 %)

eth = 1 576.52$ 7.06 (0.45 %)

gram = 1.55$ -0.01 (-0.70 %)

usd = 77.06 1.43 (1.89 %)

eur = 87.40 1.63 (1.90 %)

btc = 59 969.00$ 149.52 (0.25 %)

Нейросети смогут грамотнее писать на русском языке благодаря исследователям МГУ и Яндекса

1 минута на чтение
Трёхмерная модель кристалла: зелёные кубы — атомы/молекулы, белые линии — химические связи, образуют упорядоченную структуру.

Кодик кратко объясняет суть статьи

Яндекс и Институт ИИ МГУ представили открытый датасет LORuGEC и метод обучения нейросетей корректировке сложных правил русского языка. Датасет включает около тысячи примеров из ЕГЭ и олимпиад, размеченных экспертами-лингвистами, охватывая 48 правил, включая пунктуацию, правописание и согласование. Новый подход повышает точность исправления ошибок на 5-10%. Метод доступен для разработчиков образовательных сервисов. Результаты исследования получили награду на конференции ACL 2025.

Читайте в Telegram

|

Яндекс совместно с Институтом ИИ МГУ создал первый открытый датасет и метод обучения нейросетей сложным правилам русского языка. Об этом Яндекс сообщил на полях Конгресса молодых учёных.

Датасет LORuGEC содержит примеры из ЕГЭ и олимпиад с разметкой от лингвистов, что позволяет обучать нейросети точному исправлению ошибок без переписывания текста. На основе него можно создавать обучающие сервисы, которые не только исправляют текст, но и объясняют правила русского языка.

  • LORuGEC охватывает 48 правил русского языка, в том числе примеры с неверной пунктуацией в сложноподчинённых предложениях, ошибки в слитном и раздельном написании слов с «не», а также в согласовании сказуемого и подлежащего в сложных предложениях.
  • Всего в датасет вошла почти 1000 предложений, каждое из которых связано с конкретной языковой нормой.
  • Датасет и метод обучения выложены в открытый доступ, поэтому исследователи и разработчики могут использовать их, например, для создания образовательных сервисов для школьников и студентов.
Согласно внутренним тестам Яндекса, благодаря новому методу точность исправлений сложных ошибок выросла на 5–10% по метрике F0,5. В частности, точность YandexGPT 5 Pro достигла 83%, а YandexGPT 5 Lite — 71%.

В Яндексе также сообщили, что статья о датасете и методе дообучения нейросетей получила приз за лучшую работу на воркшопе по инновационному использованию ИИ в образовании, который прошёл в рамках международной конференции по компьютерной лингвистике ACL 2025 (А*).

Теги:
Материал обновлен|
Обсудить
Блоги 652
ЦНИС
Softline
OTP Bank
StudyAI
Т-Банк
ВТБ
Слетать.ру
ВКонтакте
билайн
Газпромбанк

Привет, это Кодик! Я создан, чтобы помогать вам с  разными задачами. Задайте мне вопрос…