20 ноября 2025

eur = 93.78 -0.15 (-0.16 %)

btc = 92 435.00$ 371.40 (0.40 %)

eth = 3 043.93$ -28.96 (-0.94 %)

ton = 1.73$ -0.04 (-2.43 %)

usd = 80.94 -0.11 (-0.14 %)

eur = 93.78 -0.15 (-0.16 %)

btc = 92 435.00$ 371.40 (0.40 %)

Языковая модель Сбера по пониманию текстов на русском языке стала лучшей в мире

1 минута на чтение
Языковая модель Сбера по пониманию текстов на русском языке стала лучшей в мире

Главный русскоязычный бенчмарк по пониманию текстов Russian SuperGLUE провёл тест, по результатам которого в лидеры вышла языковая модель от Сбера и SberDevices FRED-T5 (Full-scale Russian Enhanced Denoisers T5). Она лучше всего в мире понимает текст на русском языке, уступая по точности лишь человеку.

Первые русскоязычные модели Сбер обучил ещё в 2019 году — ruBERT и ruGPT-2. Через год при помощи суперкомпьютера Christofari была создана модель ruGPT-3, существующая в разных вариантах. Самый большой из них насчитывает 13 млрд параметров.

Но в отличие от семейства GPT, состоящих только из декодирующих блоков трансформера, FRED-T5 содержит кодирующие блоки. Это позволяет эффективнее справляться с задачами в области обработки естественного языка.

Модель реализована на базе нейросети T5, имеет 1,7 миллиарда параметров и 24 слоя. Обучение проходило на задачах восстановления случайно удалённых фрагментов текста на суперкомпьютере Christofari Neo. Чтобы FRED-T5 эффективно решала поставленные задачи, специалистам понадобилось шесть недель и около 300 Гб текста.

Сергей Марков, директор Управления экспериментальных систем машинного обучения SberDevices:

Ведущие исследовательские центры в области машинного обучения в последние годы создают всё более и более крупные нейронные языковые модели. Количество параметров самых больших монолитных нейросетей уже перевалило за 500 миллиардов и продолжает расти. Это беспрецедентные в истории человечества вычислительные проекты. Но прогресс заключается не только в создании всё более огромных нейросетевых монстров, но и в совершенствовании архитектур сетей и методов их обучения. Благодаря этому самые современные модели при том же количестве параметров интеллектуально превосходят своих предшественников. Хорошим примером этого эффекта является нейросеть FRED-T5, которая при сравнительно скромном по нынешним меркам числе параметров стала лидером в понимании русского языка.

Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) — первый рейтинг нейросетей для русского языка. Место в нём зависит от того, как нейросеть справится с заданиями на логику, здравый смысл, целеполагание и понимание смысла текста. Проект открытый, им пользуются исследователи данных, работающие с русскоязычными нейросетями.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от ГигаЧат 
1-bg-изображение-0
img-content-1-изображение-0

ГигаЧат: коротко о главном

Как изменился Код Дурова вместе с ГигаЧат?

Узнай о всех возможностях в FAQ-статье 
Разработчики представили обновление ОС «Аврора» 5.2 с новым дизайном и функциямиРазработчики представили обновление ОС «Аврора» 5.2 с новым дизайном и функциямиРазработчики представили обновление ОС «Аврора» 5.2 с новым дизайном и функциями

ГигаЧат: коротко о главном

Разработчики представили обновление ОС «Аврора» 5.2 с новым дизайном и функциями

Полная версия 
Госдума приняла закон о «технологическом сборе»

ГигаЧат: коротко о главном

Госдума приняла закон о «технологическом сборе»

Полная версия 

Реализовано через ГигаЧат 

Сейчас читают
Цифра в деле
Цифра в деле
Смотреть
Реклама. ПАО Сбербанк. erid: 2Vtzqv3u7MN
Карьера
Блоги 452
Газпромбанк
билайн
OTP Bank
МТС
Т-Банк
X5 Tech
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы