Yandex B2B Tech запустила быстрый метод дообучения нейросетей для бизнеса


Yandex B2B Tech предоставила клиентам новую возможность дообучения нейросетей методом LoRA (Low-Rank Adaptation).
Теперь компании смогут быстро и самостоятельно адаптировать нейросети под специализированные задачи: например, обучить модель писать письма в корпоративном стиле или извлекать важные данные из документов. Использование дообученной модели будет не дороже базовых версий нейросетей. Новый метод уже доступен всем клиентам на платформе для разработки ИИ-решений Yandex Cloud AI Studio.
Для дообучения методом LoRA уже доступны нейросеть YandexGPT и опенсорсная модель LLaMA. Вскоре это станет возможно и для моделей, которые можно запустить по запросу на выделенных мощностях – например, Qwen и DeepSeek. Таким образом бизнес сможет использовать в своих решениях несколько дообученных нейросетей, легко переключаться между ними и комбинировать их для разных сценариев.
Дообучение модели позволяет повысить качество решения конкретных задач: после кастомизации нейросети лучше суммаризируют и точнее классифицируют тексты, они точнее следуют заданному формату ответа и придерживаются определенной роли в диалоге. Качество ответов по этим задачам даже на облегченных моделях может быть выше, чем у мощных версий нейросетей. Дообучение особенно полезно, когда требования к ответу трудно сформулировать в коротком и понятном промте.
LoRА работает быстро за счёт того, что изменяет небольшое количество параметров при дообучении модели. Алгоритм ориентируется на эталонные запросы и ответы, заранее заданные пользователем, и приближает результаты работы модели к образцам из датасета. При обработке небольших датасетов весь процесс дообучения с помощью LoRA может занять всего 10 минут.
«Алгоритм LoRA уже признан одним из наиболее эффективных способов дообучения, и он широко используется для кастомизации моделей среди ML-разработчиков, в том числе в Яндексе. Внедрение такого инструмента – еще один шаг к многообразию и адаптивности технологий, которые упрощают решение клиентских задач», – рассказал Григорий Атрепьев, CPO Yandex Cloud.
Читать первым в Telegram-канале «Код Дурова»