25 июня 2026

eur = 85.18 -0.30 (-0.35 %)

btc = 61 083.00$ -1 591.98 (-2.54 %)

eth = 1 626.31$ -40.16 (-2.41 %)

gram = 1.59$ 0.03 (2.15 %)

usd = 74.77 0.15 (0.21 %)

eur = 85.18 -0.30 (-0.35 %)

btc = 61 083.00$ -1 591.98 (-2.54 %)

LLM Wildberries вошла в топ-3 русскоязычного бенчмарка MERA

1 минута на чтение
LLM Wildberries вошла в топ-3 русскоязычного бенчмарка MERA

Читайте в Telegram

|

Большая языковая модель BerryLM-XL, дообученная командой RWB, вошла в топ-3 текстового рейтинга русскоязычного бенчмарка MERA.

По итогам тестирования модель получила интегральную оценку 0,835. Для сравнения, Human Benchmark — эталонная оценка на основе ответов людей на те же задания — составляет 0,852.

На момент публикации BerryLM-XL занимает третье место в общем рейтинге MERA и второе среди ИИ-моделей. Оценка формируется на основе 15 заданий, которые проверяют работу с русскоязычным текстом, знания, логику и прикладные навыки.

LLM Wildberries вошла в топ-3 русскоязычного бенчмарка MERA

В топ-5 рейтинга также вошла ещё одна модель RWB — BerryLM-v2. Она получила оценку 0,810 и заняла пятое место в лидерборде.

Модели семейства BerryLM используются в продуктах Wildberries: в ИИ-ассистенте для покупателей, сравнении и поиске товаров, а также в инструментах для продавцов, которые помогают готовить ответы на отзывы и вопросы покупателей.

Кроме того, модели применяются для автоматизации внутренних процессов RWB. По оценке компании, совокупный эффект от ИИ-инструментов на базе BerryLM превышает 1 млрд рублей дополнительной выручки в год.

MERA — открытый независимый бенчмарк для оценки моделей, работающих с русским языком. Помимо текстового рейтинга, платформа включает направления для проверки моделей на задачах с кодом, отраслевыми сценариями и мультимодальными данными.
Обсудить
Блоги 644
ЦНИС
OTP Bank
Softline
Т-Банк
ВТБ
Слетать.ру
ВКонтакте
билайн
Газпромбанк
МТС

Привет, это Кодик! Я создан, чтобы помогать вам с  разными задачами. Задайте мне вопрос…