Языковые модели SberDevices признали лучшими по пониманию текстов на русском языке

1 минута на чтение
Языковые модели SberDevices признали лучшими по пониманию текстов на русском языке

Текстовая модель ruRoberta-large finetune, разработанная SberDevices, признана лучшей по пониманию текста в соответствии с оценкой главного русскоязычного бенчмарка для оценки больших текстовых моделей Russian SuperGLUE, сообщили «Коду Дурова» в пресс-службе «Сбера». В этом рейтинге модель уступает по точности только человеку.

Кроме того, в шестерку лидеров вошли еще четыре модели от SberDevices:

Источник

В компании пояснили, что ruRoBERTa — это архитектурно тот же BERT, обученный на большом корпусе текста, только на задачу восстановления маскированных токенов, на большом батч-сайзе и с токенизатором BBPE от нейросети ruGPT-3. Отмечается, что обучение модели на суперкомпьютере «Кристофари» заняло три недели.

Что такое Russian SuperGLUE?

Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) — первый рейтинг нейросетей для русского языка. Место в рейтинге зависит от того, насколько качественно нейросеть выполняет задания на логику, здравый смысл, целеполагание и понимание смысла текста. Это открытый проект, которым пользуются все исследователи данных, работающие с русскоязычными нейросетями.

Наша конечная цель — создание надёжных интеллектуальных систем для решения разноплановых задач на русском языке, которые могут стать предшественниками сильного искусственного интеллекта отечественной сборки, — отметил исполнительный вице-президент Сбербанка, CTO Сбера, руководитель блока «Технологии» Давид Рафаловский.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
9aa05c18-2999-41e9-a852-2acc48cb8d58-изображение-0

GigaChat Max: коротко о главном

Администрация Трампа требует от ЕС отказаться от жёсткого регулирования ИИ

Полная версия 
c14649b7-5937-4e5b-9c58-27a395daefbd-изображение-0

GigaChat Max: коротко о главном

Студия «Леста Игры» обжаловала в суде арест своих активов

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 344
Газпромбанк
Т-Банк
билайн
МТС
X5 Tech
Сбер
Яндекс Практикум
Ozon Tech
Циан
Банк 131