17 января 2025

eur = 105.81 -0.29 (-0.27 %)

btc = 104 735.00$ 5 309.76 (5.34 %)

eth = 3 422.07$ 102.72 (3.09 %)

ton = 5.55$ 0.02 (0.41 %)

usd = 102.38 -0.43 (-0.42 %)

eur = 105.81 -0.29 (-0.27 %)

btc = 104 735.00$ 5 309.76 (5.34 %)

Форум

Языковая модель Сбера по пониманию текстов на русском языке стала лучшей в мире

1 минута на чтение
Языковая модель Сбера по пониманию текстов на русском языке стала лучшей в мире

Главный русскоязычный бенчмарк по пониманию текстов Russian SuperGLUE провёл тест, по результатам которого в лидеры вышла языковая модель от Сбера и SberDevices FRED-T5 (Full-scale Russian Enhanced Denoisers T5). Она лучше всего в мире понимает текст на русском языке, уступая по точности лишь человеку.

Первые русскоязычные модели Сбер обучил ещё в 2019 году — ruBERT и ruGPT-2. Через год при помощи суперкомпьютера Christofari была создана модель ruGPT-3, существующая в разных вариантах. Самый большой из них насчитывает 13 млрд параметров.

Но в отличие от семейства GPT, состоящих только из декодирующих блоков трансформера, FRED-T5 содержит кодирующие блоки. Это позволяет эффективнее справляться с задачами в области обработки естественного языка.

Модель реализована на базе нейросети T5, имеет 1,7 миллиарда параметров и 24 слоя. Обучение проходило на задачах восстановления случайно удалённых фрагментов текста на суперкомпьютере Christofari Neo. Чтобы FRED-T5 эффективно решала поставленные задачи, специалистам понадобилось шесть недель и около 300 Гб текста.

Сергей Марков, директор Управления экспериментальных систем машинного обучения SberDevices:

Ведущие исследовательские центры в области машинного обучения в последние годы создают всё более и более крупные нейронные языковые модели. Количество параметров самых больших монолитных нейросетей уже перевалило за 500 миллиардов и продолжает расти. Это беспрецедентные в истории человечества вычислительные проекты. Но прогресс заключается не только в создании всё более огромных нейросетевых монстров, но и в совершенствовании архитектур сетей и методов их обучения. Благодаря этому самые современные модели при том же количестве параметров интеллектуально превосходят своих предшественников. Хорошим примером этого эффекта является нейросеть FRED-T5, которая при сравнительно скромном по нынешним меркам числе параметров стала лидером в понимании русского языка.

Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) — первый рейтинг нейросетей для русского языка. Место в нём зависит от того, как нейросеть справится с заданиями на логику, здравый смысл, целеполагание и понимание смысла текста. Проект открытый, им пользуются исследователи данных, работающие с русскоязычными нейросетями.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
7ba443e5-f9a7-4258-8b06-3908d3e33892-изображение-0

GigaChat Max: коротко о главном

Верховных суд США поддержал запрет TikTok

Полная версия 
d31a08b1-3a4e-4da4-b625-8fbcb433fe8e-изображение-06dde2b5c-920a-4842-9e41-739bb8ac7987-изображение-139d1a33e-8eae-462a-80d4-f2ea438ff8db-изображение-2

GigaChat Max: коротко о главном

В Россию приехали Huawei nova 13 и Huawei nova 13 Pro: что нового и интересного?

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 307
Газпромбанк
МТС
Т-Банк
X5 Tech
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131