Yandex B2B Tech запустила быстрый метод дообучения нейросетей для бизнеса


GigaChat Max кратко объясняет суть статьи
Yandex B2B Tech представила своим клиентам возможность дообучения нейросетей методом LoRA, что позволит компаниям быстро адаптировать модели под специфические задачи, такие как написание писем в корпоративном стиле или извлечение данных из документов. Этот метод доступен на платформе Yandex Cloud AI Studio и применим к моделям YandexGPT и LLaMA, а вскоре станет доступен и для других моделей. Дообучение улучшает точность и качество решений, особенно в случаях, когда требования к ответу сложно сформулировать кратко. Процесс дообучения занимает всего 10 минут благодаря изменению небольшого количества параметров модели.
Yandex B2B Tech предоставила клиентам новую возможность дообучения нейросетей методом LoRA (Low-Rank Adaptation).
Теперь компании смогут быстро и самостоятельно адаптировать нейросети под специализированные задачи: например, обучить модель писать письма в корпоративном стиле или извлекать важные данные из документов. Использование дообученной модели будет не дороже базовых версий нейросетей. Новый метод уже доступен всем клиентам на платформе для разработки ИИ-решений Yandex Cloud AI Studio.
Для дообучения методом LoRA уже доступны нейросеть YandexGPT и опенсорсная модель LLaMA. Вскоре это станет возможно и для моделей, которые можно запустить по запросу на выделенных мощностях – например, Qwen и DeepSeek. Таким образом бизнес сможет использовать в своих решениях несколько дообученных нейросетей, легко переключаться между ними и комбинировать их для разных сценариев.
Дообучение модели позволяет повысить качество решения конкретных задач: после кастомизации нейросети лучше суммаризируют и точнее классифицируют тексты, они точнее следуют заданному формату ответа и придерживаются определенной роли в диалоге. Качество ответов по этим задачам даже на облегченных моделях может быть выше, чем у мощных версий нейросетей. Дообучение особенно полезно, когда требования к ответу трудно сформулировать в коротком и понятном промте.
LoRА работает быстро за счёт того, что изменяет небольшое количество параметров при дообучении модели. Алгоритм ориентируется на эталонные запросы и ответы, заранее заданные пользователем, и приближает результаты работы модели к образцам из датасета. При обработке небольших датасетов весь процесс дообучения с помощью LoRA может занять всего 10 минут.
«Алгоритм LoRA уже признан одним из наиболее эффективных способов дообучения, и он широко используется для кастомизации моделей среди ML-разработчиков, в том числе в Яндексе. Внедрение такого инструмента – еще один шаг к многообразию и адаптивности технологий, которые упрощают решение клиентских задач», – рассказал Григорий Атрепьев, CPO Yandex Cloud.
Читать первым в Telegram-канале «Код Дурова»