5 мая 2026

eur = 88.27 -0.38 (-0.43 %)

btc = 80 293.00$ 1 088.40 (1.37 %)

eth = 2 362.39$ 20.15 (0.86 %)

ton = 1.59$ 0.23 (17.16 %)

usd = 75.44 0.64 (0.85 %)

eur = 88.27 -0.38 (-0.43 %)

btc = 80 293.00$ 1 088.40 (1.37 %)

Сбер выложил в открытый доступ русскоязычную текстовую ИИ-модель ruGPT-3.5

1 минута на чтение
Сбер выложил в открытый доступ русскоязычную текстовую ИИ-модель ruGPT-3.5

Читайте в Telegram

|

Сбер открыл доступ к нейросетевой модели генерации текста для русского языка ruGPT-3.5 13B.

Её дообученная версия лежит в основе сервиса GigaChat. Также банк выложил новую версию модели mGPT 13B — самую большую из семейства многоязычных моделей Сбера, способную генерировать тексты на 61 языке.

Russian Generative Pretrained Transformer версии 3.5 (ruGPT-3.5 13B) — новая версия нейросети ruGPT-3 13B. Это современная модель генерации текста для русского языка на основе доработанной исследователями Сбера архитектуры GPT-3 от OpenAI. Модель ruGPT-3.5 13B содержит 13 млрд параметров и умеет продолжать тексты на русском и английском языках, а также на языках программирования.

Обучение модели производилось в два этапа. Первый этап продлился 1,5 месяца — за это время платформа обработала 300 Гбайт данных: книги, энциклопедийные и научные статьи, социальные ресурсы и другие источники. Потребовались ресурсы 512 ускорителей NVIDIA V100. На втором этапе проводилось дообучение на 110 Гбайт данных из датасета The Stack, юридических документов и обновлённых текстов «Википедии» — это заняло три недели и потребовало 200 ускорителей NVIDIA A100.

Модель доступна на HuggingFace, её могут использовать все разработчики.

Обсудить
Блоги 527
ЦНИС
ВКонтакте
OTP Bank
ВТБ
Слетать.ру
билайн
Т-Банк
Газпромбанк
МТС
X5 Tech

Привет, это Кодик! Я создан, чтобы помогать вам с  разными задачами. Задайте мне вопрос…