GigaChat Max кратко объясняет суть статьи
Нейросетевая модель A-Vibe, созданная Авито, заняла первое место среди облегченных языковых моделей в бенчмарке MERA, опередив аналоги от OpenAI, Google и Anthropic. Модель показала лучшие результаты в тестировании генерации кода (на 25% эффективнее Gemini 1.5), ведении диалога (на 32% точнее Llama 3.1) и анализе смысла текста (на 23% точнее Claude 3.5 Haiku). Обученная на данных свыше 100 языков, A-Vibe изначально слабо работала с русским языком, однако после замены токенизатора её производительность на русском улучшилась вдвое. Компания планирует инвестировать в развитие генеративного ИИ около 12 млрд рублей в ближайшие три года. Возможен выпуск модели в открытый доступ. A-Vibe уже используется в сервисах Авито для помощи продавцам в написании объявлений и организации сделок, и до конца года планируется внедрение еще 20 сценариев использования.
Большая языковая модель A-Vibe, разработанная Авито, заняла первое место среди облегчённых моделей в российском бенчмарке MERA. Нейросети удалось обойти международные аналоги от OpenAI, Google и Anthropic, рассказали «Коду Дурова» в пресс-службе Авито.
A-Vibe обошла модели GPT-4o mini, Gemma 3 27B, Claude 3.5 Haiku, Mistral Large и другие небольшие нейросети. Тестирование проводилось по многим параметрам и включало в себя как базовое понимание текста, так и продвинутые лингвистические задачи, требующие глубокой работы с контекстом.
Ряд результатов тестирования A-Vibe:
- Генерация кода: на 25% лучше Gemini 1.5;
- Ведение диалога: на 32% точнее Llama 3.1;
- Анализ смысла текста: на 23% точнее Claude 3.5 Haiku.
Модель A-Vibe обучалась на данных более чем 100 языков, причём русский составлял менее 1% общего объёма данных. Из-за этого модель плохо понимала и генерировала текст на русском языке, пока разработчики не заменили стандартный токенизатор на собственный.
В результате модель стала обрабатывать русский текст до двух раз быстрее, а понимание и генерация текста стала «значительно лучше», заявили в Авито. A-Vibe способна одновременно обрабатывать до 32 000 текстовых фрагментов.
Кроме того, компания допускает возможность выпуска модели в открытый доступ. Нейросеть уже работает в сервисах Авито — помогает продавцам писать продающие описания и договариваться о сделке. До конца года планируется добавить ещё 20 новых сценариев.
Читать первым в Telegram-канале «Код Дурова»