18 октября 2025

eur = 94.58 2.50 (2.72 %)

btc = 107 112.00$ -2 060.66 (-1.89 %)

eth = 3 875.04$ -56.62 (-1.44 %)

ton = 2.13$ -0.06 (-2.87 %)

usd = 80.98 1.90 (2.40 %)

eur = 94.58 2.50 (2.72 %)

btc = 107 112.00$ -2 060.66 (-1.89 %)

Языковые модели SberDevices признали лучшими по пониманию текстов на русском языке

1 минута на чтение
Языковые модели SberDevices признали лучшими по пониманию текстов на русском языке

Текстовая модель ruRoberta-large finetune, разработанная SberDevices, признана лучшей по пониманию текста в соответствии с оценкой главного русскоязычного бенчмарка для оценки больших текстовых моделей Russian SuperGLUE, сообщили «Коду Дурова» в пресс-службе «Сбера». В этом рейтинге модель уступает по точности только человеку.

Кроме того, в шестерку лидеров вошли еще четыре модели от SberDevices:

Языковые модели SberDevices признали лучшими по пониманию текстов на русском языке
Источник

В компании пояснили, что ruRoBERTa — это архитектурно тот же BERT, обученный на большом корпусе текста, только на задачу восстановления маскированных токенов, на большом батч-сайзе и с токенизатором BBPE от нейросети ruGPT-3. Отмечается, что обучение модели на суперкомпьютере «Кристофари» заняло три недели.

Что такое Russian SuperGLUE?

Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) — первый рейтинг нейросетей для русского языка. Место в рейтинге зависит от того, насколько качественно нейросеть выполняет задания на логику, здравый смысл, целеполагание и понимание смысла текста. Это открытый проект, которым пользуются все исследователи данных, работающие с русскоязычными нейросетями.

Наша конечная цель — создание надёжных интеллектуальных систем для решения разноплановых задач на русском языке, которые могут стать предшественниками сильного искусственного интеллекта отечественной сборки, — отметил исполнительный вице-президент Сбербанка, CTO Сбера, руководитель блока «Технологии» Давид Рафаловский.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от ГигаЧат 
1-bg-изображение-0
img-content-1-изображение-0

ГигаЧат: коротко о главном

Как изменился Код Дурова вместе с ГигаЧат?

Узнай о всех возможностях в FAQ-статье 
В Сеть якобы утекли базы SMS-агрегаторов — всего 3 ТБ данныхВ Сеть якобы утекли базы SMS-агрегаторов — всего 3 ТБ данных

ГигаЧат: коротко о главном

В Сеть якобы утекли базы SMS-агрегаторов — всего 3 ТБ данных

Полная версия 
Apple обвинила Epic Games в уклонении от комиссий App Store

ГигаЧат: коротко о главном

Apple обвинила Epic Games в уклонении от комиссий App Store

Полная версия 

Реализовано через ГигаЧат 

Сейчас читают
Цифра в деле
Цифра в деле
Смотреть
Реклама. ПАО Сбербанк. erid: 2Vtzqv3u7MN
Карьера
Блоги 434
Газпромбанк
OTP Bank
МТС
Т-Банк
X5 Tech
билайн
Сбер
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы