Yandex B2B Tech запустила быстрый метод дообучения нейросетей для бизнеса

1 минута на чтение

На изображении представлен синий фон с абстрактными фигурами.

GigaChat Max кратко объясняет суть статьи

Yandex B2B Tech внедрила технологию LoRA (Low-Rank Adaptation), позволяющую клиентам самостоятельно дообучать нейросети под специфические задачи. Для компаний доступна дообучка моделей YandexGPT и LLaMA, а также планируется поддержка моделей Qwen и DeepSeek на выделенных мощностях. Это позволит бизнесу гибко использовать несколько дообученных нейросетей, повышать точность решения узких задач и улучшать качество ответов по сравнению с базовыми версиями. Благодаря изменению небольшого числа параметров, дообучение занимает считанные минуты и не увеличивает стоимость использования.

Реализовано через GigaChat Max

developers.sber.ru

О рекламодателеРеклама ПАО Сбербанкerid: 2VtzqvWbqb5

Yandex B2B Tech предоставила клиентам новую возможность дообучения нейросетей методом LoRA (Low-Rank Adaptation).

Теперь компании смогут быстро и самостоятельно адаптировать нейросети под специализированные задачи: например, обучить модель писать письма в корпоративном стиле или извлекать важные данные из документов. Использование дообученной модели будет не дороже базовых версий нейросетей. Новый метод уже доступен всем клиентам на платформе для разработки ИИ-решений Yandex Cloud AI Studio.

Для дообучения методом LoRA уже доступны нейросеть YandexGPT и опенсорсная модель LLaMA. Вскоре это станет возможно и для моделей, которые можно запустить по запросу на выделенных мощностях – например, Qwen и DeepSeek. Таким образом бизнес сможет использовать в своих решениях несколько дообученных нейросетей, легко переключаться между ними и комбинировать их для разных сценариев.

Дообучение модели позволяет повысить качество решения конкретных задач: после кастомизации нейросети лучше суммаризируют и точнее классифицируют тексты, они точнее следуют заданному формату ответа и придерживаются определенной роли в диалоге. Качество ответов по этим задачам даже на облегченных моделях может быть выше, чем у мощных версий нейросетей. Дообучение особенно полезно, когда требования к ответу трудно сформулировать в коротком и понятном промте.

LoRА работает быстро за счёт того, что изменяет небольшое количество параметров при дообучении модели. Алгоритм ориентируется на эталонные запросы и ответы, заранее заданные пользователем, и приближает результаты работы модели к образцам из датасета. При обработке небольших датасетов весь процесс дообучения с помощью LoRA может занять всего 10 минут.

«Алгоритм LoRA уже признан одним из наиболее эффективных способов дообучения, и он широко используется для кастомизации моделей среди ML-разработчиков, в том числе в Яндексе. Внедрение такого инструмента – еще один шаг к многообразию и адаптивности технологий, которые упрощают решение клиентских задач», – рассказал Григорий Атрепьев, CPO Yandex Cloud.

Читать первым в Telegram-канале «Код Дурова»