Нейросеть A-Vibe заняла первое место в рейтинге MERA

1,1к

1 минута на чтение

Нейросеть A-Vibe заняла первое место в рейтинге MERA

GigaChat Max кратко объясняет суть статьи

Нейросетевая модель A-Vibe, созданная Авито, заняла первое место среди облегченных языковых моделей в бенчмарке MERA, опередив аналоги от OpenAI, Google и Anthropic. Модель показала лучшие результаты в тестировании генерации кода (на 25% эффективнее Gemini 1.5), ведении диалога (на 32% точнее Llama 3.1) и анализе смысла текста (на 23% точнее Claude 3.5 Haiku). Обученная на данных свыше 100 языков, A-Vibe изначально слабо работала с русским языком, однако после замены токенизатора её производительность на русском улучшилась вдвое. Компания планирует инвестировать в развитие генеративного ИИ около 12 млрд рублей в ближайшие три года. Возможен выпуск модели в открытый доступ. A-Vibe уже используется в сервисах Авито для помощи продавцам в написании объявлений и организации сделок, и до конца года планируется внедрение еще 20 сценариев использования.

Реализовано через GigaChat Max

developers.sber.ru

О рекламодателеРеклама ПАО Сбербанкerid: 2VtzqvWbqb5

Большая языковая модель A-Vibe, разработанная Авито, заняла первое место среди облегчённых моделей в российском бенчмарке MERA. Нейросети удалось обойти международные аналоги от OpenAI, Google и Anthropic, рассказали «Коду Дурова» в пресс-службе Авито.

A-Vibe обошла модели GPT-4o mini, Gemma 3 27B, Claude 3.5 Haiku, Mistral Large и другие небольшие нейросети. Тестирование проводилось по многим параметрам и включало в себя как базовое понимание текста, так и продвинутые лингвистические задачи, требующие глубокой работы с контекстом.

Авито инвестирует в GenAI более 12 млрд рублей – компания представила собственное семейство генеративных моделей

В ближайшие 3 года Авито планирует инвестировать около 12 миллиардов рублей в развитие генеративного искусственного интеллекта.

Код ДуроваКод

Ряд результатов тестирования A-Vibe:

Генерация кода: на 25% лучше Gemini 1.5;
Ведение диалога: на 32% точнее Llama 3.1;
Анализ смысла текста: на 23% точнее Claude 3.5 Haiku.

Модель A-Vibe обучалась на данных более чем 100 языков, причём русский составлял менее 1% общего объёма данных. Из-за этого модель плохо понимала и генерировала текст на русском языке, пока разработчики не заменили стандартный токенизатор на собственный.

В результате модель стала обрабатывать русский текст до двух раз быстрее, а понимание и генерация текста стала «значительно лучше», заявили в Авито. A-Vibe способна одновременно обрабатывать до 32 000 текстовых фрагментов.

Кроме того, компания допускает возможность выпуска модели в открытый доступ. Нейросеть уже работает в сервисах Авито — помогает продавцам писать продающие описания и договариваться о сделке. До конца года планируется добавить ещё 20 новых сценариев.

Теги:

Читать первым в Telegram-канале «Код Дурова»