Сбер выложил в открытый доступ русскоязычную текстовую ИИ-модель ruGPT-3.5

1 минута на чтение
Сбер выложил в открытый доступ русскоязычную текстовую ИИ-модель ruGPT-3.5

Сбер открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B.

Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке.

Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 млрд параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования.

Обучение модели производилось в два этапа. Первый этап продлился 1,5 месяца — за это время платформа обработала 300 Гбайт данных: книги, энциклопедийные и научные статьи, социальные ресурсы и другие источники. Потребовались ресурсы 512 ускорителей NVIDIA V100. На втором этапе проводилось дообучение на 110 Гбайт данных из датасета The Stack, юридических документов и обновлённых текстов «Википедии» — это заняло три недели и потребовало 200 ускорителей NVIDIA A100.

Модель доступна на HuggingFace, её могут использовать все разработчики.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
fd0c4356-68be-4671-914f-60069a5460aa-изображение-0c7b21ec0-84d5-46a4-9b61-07e108f75920-изображение-16554b4c4-ca2d-44b3-9d20-4a53a8bccf6b-изображение-2

GigaChat Max: коротко о главном

Представлен планшет «Р-Таб» на базе «Роса Мобайл»

Полная версия 
4e5ee1f6-8108-433d-9cce-d03c2779a2f4-изображение-05f59f732-aaa4-4b5a-ae23-6eb984a87c2a-изображение-1e3e02f02-39d2-4d8d-a17f-245ccfb39e3e-изображение-2

GigaChat Max: коротко о главном

Alibaba представила семейство ИИ-моделей Qwen3, конкурирующее с решениями Google и OpenAI

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 345
билайн
Газпромбанк
Т-Банк
МТС
X5 Tech
Сбер
Яндекс Практикум
Ozon Tech
Циан
Банк 131