15 июля 2025

eur = 91.77 0.65 (0.72 %)

btc = 116 779.00$ -6 001.16 (-4.89 %)

eth = 2 980.91$ -63.19 (-2.08 %)

ton = 2.97$ -0.08 (-2.61 %)

usd = 78.37 0.49 (0.62 %)

eur = 91.77 0.65 (0.72 %)

btc = 116 779.00$ -6 001.16 (-4.89 %)

Yandex B2B Tech запустила быстрый метод дообучения нейросетей для бизнеса

1 минута на чтение
На изображении представлен синий фон с абстрактными фигурами.Как видит новость Kandinsky

GigaChat Max кратко объясняет суть статьи

Yandex B2B Tech внедрила технологию LoRA (Low-Rank Adaptation), позволяющую клиентам самостоятельно дообучать нейросети под специфические задачи. Для компаний доступна дообучка моделей YandexGPT и LLaMA, а также планируется поддержка моделей Qwen и DeepSeek на выделенных мощностях. Это позволит бизнесу гибко использовать несколько дообученных нейросетей, повышать точность решения узких задач и улучшать качество ответов по сравнению с базовыми версиями. Благодаря изменению небольшого числа параметров, дообучение занимает считанные минуты и не увеличивает стоимость использования.

Yandex B2B Tech предоставила клиентам новую возможность дообучения нейросетей методом LoRA (Low-Rank Adaptation).

Теперь компании смогут быстро и самостоятельно адаптировать нейросети под специализированные задачи: например, обучить модель писать письма в корпоративном стиле или извлекать важные данные из документов. Использование дообученной модели будет не дороже базовых версий нейросетей. Новый метод уже доступен всем клиентам на  платформе для разработки ИИ-решений Yandex Cloud AI Studio.

Для дообучения методом LoRA уже доступны нейросеть YandexGPT и опенсорсная модель LLaMA. Вскоре это станет возможно и для моделей, которые можно запустить по запросу на выделенных мощностях – например, Qwen и DeepSeek. Таким образом бизнес сможет использовать в своих решениях несколько дообученных нейросетей, легко переключаться между ними и комбинировать их для разных сценариев.

Дообучение модели позволяет повысить качество решения конкретных задач: после кастомизации нейросети лучше суммаризируют и точнее классифицируют тексты, они точнее следуют заданному формату ответа и придерживаются определенной роли в диалоге. Качество ответов по этим задачам даже на облегченных моделях может быть выше, чем у мощных версий нейросетей. Дообучение особенно полезно, когда требования к ответу трудно сформулировать в коротком и понятном промте.

LoRА работает быстро за счёт того, что изменяет небольшое количество параметров при дообучении модели. Алгоритм ориентируется на эталонные запросы и ответы, заранее заданные пользователем, и приближает результаты работы модели к образцам из датасета. При обработке небольших датасетов весь процесс дообучения с помощью LoRA может занять всего 10 минут.

«Алгоритм LoRA уже признан одним из наиболее эффективных способов дообучения, и он широко используется для кастомизации моделей среди ML-разработчиков, в том числе в Яндексе. Внедрение такого инструмента – еще один шаг к многообразию и адаптивности технологий, которые упрощают решение клиентских задач», – рассказал Григорий Атрепьев, CPO Yandex Cloud.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
Cyberpunk 2077 выйдет на macOS 17 июляCyberpunk 2077 выйдет на macOS 17 июля

GigaChat Max: коротко о главном

Cyberpunk 2077 выйдет на macOS 17 июля

Полная версия 
Эксперты раскрыли многомилионные доходы сайтов с нейросетями для «раздевания»Эксперты раскрыли многомилионные доходы сайтов с нейросетями для «раздевания»

GigaChat Max: коротко о главном

Эксперты раскрыли многомилионные доходы сайтов с нейросетями для «раздевания»

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Новости
Карьера
Блоги 377
OTP Bank
Газпромбанк
Сбер
Т-Банк
X5 Tech
билайн
МТС
Яндекс Практикум
Ozon Tech
Циан

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы