Т-банк выпустил в открытый доступ большую языковую модель T-Pro на 32 млрд параметров
Т-банк, входящий в группу «Т-технологии», открыл доступ к двум большим языковым моделям (LLM): T-Pro, которая обладает 32 млрд параметров, и обновленной версии T-Lite на 7 млрд параметров.
Как сообщают представители банка, это решение нацелено на поддержку бизнеса любых размеров, предоставляя возможность бесплатно использовать модели для внутренних задач и создания продуктов на базе LLM.
Особенности новых моделей:
- T-Pro отличается повышенной точностью, возможностью обработки большого объема контекста и более сложными выводами благодаря увеличенному числу параметров.
- Обе модели дообучены и адаптированы под русский язык на основе Qwen-2.5 от Alibaba Group, что позволило существенно сократить затраты на разработку – на 80–90% по сравнению с обучением с нуля.
Модели T-Lite и T-Pro входят в семейство Gen-T, созданное для решения узкоспециализированных задач. В отличие от универсальных решений, таких как ChatGPT, они ориентированы на конкретные бизнес-потребности. Например, они могут быть использованы для создания умных чат-ботов, автоматического написания кода, составления отчетов и исследований.
Отмечается, что благодаря адаптации моделей Qwen, «Т-технологии» утверждают, что их решения превосходят по качеству конкурентов, таких как OpenAI, Google и Anthropic, на русском языке. По словам экспертов, модели Qwen демонстрируют сильные результаты, особенно в математической логике и сложных вычислениях.
Читать первым в Telegram-канале «Код Дурова»