21 апреля 2025

eur = 92.22 -1.03 (-1.10 %)

btc = 85 000.00$ - 313.71 (-0.37 %)

eth = 1 586.21$ -32.81 (-2.03 %)

ton = 3.01$ 0.03 (1.13 %)

usd = 81.14 -0.88 (-1.08 %)

eur = 92.22 -1.03 (-1.10 %)

btc = 85 000.00$ - 313.71 (-0.37 %)

Yandex B2B Tech запустила быстрый метод дообучения нейросетей для бизнеса

1 минута на чтение
Yandex B2B Tech запустила быстрый метод дообучения нейросетей для бизнесаКак видит новость Kandinsky

GigaChat Max кратко объясняет суть статьи

Yandex B2B Tech представила своим клиентам возможность дообучения нейросетей методом LoRA, что позволит компаниям быстро адаптировать модели под специфические задачи, такие как написание писем в корпоративном стиле или извлечение данных из документов. Этот метод доступен на платформе Yandex Cloud AI Studio и применим к моделям YandexGPT и LLaMA, а вскоре станет доступен и для других моделей. Дообучение улучшает точность и качество решений, особенно в случаях, когда требования к ответу сложно сформулировать кратко. Процесс дообучения занимает всего 10 минут благодаря изменению небольшого количества параметров модели.

Yandex B2B Tech предоставила клиентам новую возможность дообучения нейросетей методом LoRA (Low-Rank Adaptation).

Теперь компании смогут быстро и самостоятельно адаптировать нейросети под специализированные задачи: например, обучить модель писать письма в корпоративном стиле или извлекать важные данные из документов. Использование дообученной модели будет не дороже базовых версий нейросетей. Новый метод уже доступен всем клиентам на  платформе для разработки ИИ-решений Yandex Cloud AI Studio.

Для дообучения методом LoRA уже доступны нейросеть YandexGPT и опенсорсная модель LLaMA. Вскоре это станет возможно и для моделей, которые можно запустить по запросу на выделенных мощностях – например, Qwen и DeepSeek. Таким образом бизнес сможет использовать в своих решениях несколько дообученных нейросетей, легко переключаться между ними и комбинировать их для разных сценариев.

Дообучение модели позволяет повысить качество решения конкретных задач: после кастомизации нейросети лучше суммаризируют и точнее классифицируют тексты, они точнее следуют заданному формату ответа и придерживаются определенной роли в диалоге. Качество ответов по этим задачам даже на облегченных моделях может быть выше, чем у мощных версий нейросетей. Дообучение особенно полезно, когда требования к ответу трудно сформулировать в коротком и понятном промте.

LoRА работает быстро за счёт того, что изменяет небольшое количество параметров при дообучении модели. Алгоритм ориентируется на эталонные запросы и ответы, заранее заданные пользователем, и приближает результаты работы модели к образцам из датасета. При обработке небольших датасетов весь процесс дообучения с помощью LoRA может занять всего 10 минут.

«Алгоритм LoRA уже признан одним из наиболее эффективных способов дообучения, и он широко используется для кастомизации моделей среди ML-разработчиков, в том числе в Яндексе. Внедрение такого инструмента – еще один шаг к многообразию и адаптивности технологий, которые упрощают решение клиентских задач», – рассказал Григорий Атрепьев, CPO Yandex Cloud.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
8d769568-e2fc-41fd-8699-119a062d1876-изображение-0a5e84c28-3067-43c5-8780-eff527ea4343-изображение-1

GigaChat Max: коротко о главном

В WhatsApp появилась функция перевода сообщений с поддержкой русского языка

Полная версия 
201f07c2-d56f-46b1-9a83-7b60c548c9a8-изображение-0

GigaChat Max: коротко о главном

Минтранс анонсировал появление на дорогах беспилотных авто к 2027 году

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 341
МТС
Газпромбанк
X5 Tech
Сбер
Т-Банк
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131