1 июля 2025

eur = 92.27 -0.01 (-0.01 %)

btc = 107 359.00$ - 191.28 (-0.18 %)

eth = 2 467.04$ 32.09 (1.32 %)

ton = 2.95$ 0.08 (2.75 %)

usd = 78.53 0.06 (0.08 %)

eur = 92.27 -0.01 (-0.01 %)

btc = 107 359.00$ - 191.28 (-0.18 %)

Языковая модель Сбера по пониманию текстов на русском языке стала лучшей в мире

1 минута на чтение
Языковая модель Сбера по пониманию текстов на русском языке стала лучшей в мире

Главный русскоязычный бенчмарк по пониманию текстов Russian SuperGLUE провёл тест, по результатам которого в лидеры вышла языковая модель от Сбера и SberDevices FRED-T5 (Full-scale Russian Enhanced Denoisers T5). Она лучше всего в мире понимает текст на русском языке, уступая по точности лишь человеку.

Первые русскоязычные модели Сбер обучил ещё в 2019 году — ruBERT и ruGPT-2. Через год при помощи суперкомпьютера Christofari была создана модель ruGPT-3, существующая в разных вариантах. Самый большой из них насчитывает 13 млрд параметров.

Но в отличие от семейства GPT, состоящих только из декодирующих блоков трансформера, FRED-T5 содержит кодирующие блоки. Это позволяет эффективнее справляться с задачами в области обработки естественного языка.

Модель реализована на базе нейросети T5, имеет 1,7 миллиарда параметров и 24 слоя. Обучение проходило на задачах восстановления случайно удалённых фрагментов текста на суперкомпьютере Christofari Neo. Чтобы FRED-T5 эффективно решала поставленные задачи, специалистам понадобилось шесть недель и около 300 Гб текста.

Сергей Марков, директор Управления экспериментальных систем машинного обучения SberDevices:

Ведущие исследовательские центры в области машинного обучения в последние годы создают всё более и более крупные нейронные языковые модели. Количество параметров самых больших монолитных нейросетей уже перевалило за 500 миллиардов и продолжает расти. Это беспрецедентные в истории человечества вычислительные проекты. Но прогресс заключается не только в создании всё более огромных нейросетевых монстров, но и в совершенствовании архитектур сетей и методов их обучения. Благодаря этому самые современные модели при том же количестве параметров интеллектуально превосходят своих предшественников. Хорошим примером этого эффекта является нейросеть FRED-T5, которая при сравнительно скромном по нынешним меркам числе параметров стала лидером в понимании русского языка.

Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) — первый рейтинг нейросетей для русского языка. Место в нём зависит от того, как нейросеть справится с заданиями на логику, здравый смысл, целеполагание и понимание смысла текста. Проект открытый, им пользуются исследователи данных, работающие с русскоязычными нейросетями.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
2737c621-d628-4a44-9350-431fc416c777-изображение-0648c944a-47e1-4190-a7e4-00141e05901a-изображение-1

GigaChat Max: коротко о главном

Инсайдер: Apple разрабатывает 7 AR- и VR-устройств, которые выйдут в ближайшие четыре года

Полная версия 
a96a0e6a-3fe9-4b49-b564-965013b85900-изображение-0da98c41b-6488-405f-bad3-8e0963b48652-изображение-1

GigaChat Max: коротко о главном

В Китае провели футбольный матч между гуманоидными роботами

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 366
X5 Tech
Газпромбанк
билайн
Сбер
Т-Банк
МТС
Яндекс Практикум
Ozon Tech
Циан
Банк 131

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы