Авито инвестирует в GenAI более 12 млрд рублей – компания представила собственное семейство генеративных моделей


GigaChat Max кратко объясняет суть статьи
Авито планирует вложить 12 млрд рублей в развитие генеративного ИИ, ожидая выручку свыше 21 млрд рублей. Уже запущенные продукты с использованием GenAI принесли 670 млн рублей в первый год. Основные цели инвестиций — улучшение рекомендаций, увеличение числа покупок и продаж через автоматическое создание текстов и помощь в заключении сделок. Компания представила собственные модели A-Vibe (текстовая) и A-Vision (мультимодальная), которые помогают в создании описаний, подсказках в мессенджерах, общении с покупателями и анализе отзывов. Модели обучались на основе нейросети Qwen2.5 и данных Авито. Для подготовки специалистов компания запускает образовательные программы в ведущих вузах страны.
В ближайшие 3 года Авито планирует инвестировать около 12 миллиардов рублей в развитие генеративного искусственного интеллекта. В ответ на эти вложения компания рассчитывает получить свыше 21 миллиарда рублей выручки. Первые продукты с использованием GenAI были запущены уже в 2024 году и на старте принесли 670 миллионов рублей годовой выручки.
Ключевой экономический эффект планируют достигнуть за счет улучшения рекомендаций, увеличения количества покупок и продаж на платформе: более качественные и продающие тексты, а также ассистирование в мессенджерах должно ускорить заключение сделок.
«В стратегию внедрения генеративного ИИ мы изначально заложили подход с положительным ROI: инвестиции должны принести прибыль. Мы не хотим инвестировать деньги просто в модную технологию. Наш кейс показывает рынку, что на GenAI действительно можно зарабатывать. Мы планировали вернуть вложения за 5 лет, но уже в первом году получилось заработать выручку», — рассказал Андрей Рыбинцев.
Собственное семейство генеративных моделей
Авито показало собственные модели, обученные на открытой модели Qwen2.5 – текстовую A-Vibe и мультимодальную A-Vision. Они помогут пользователям автоматически генерировать описания товаров и быстрее договариваться о покупке и продаже.
На первом этапе модели предлагают следующий функционал:
- Нейро-описания объявлений. Модель помогает продавцам автоматически создавать лаконичные и продающие тексты, адаптированные под конкретную категорию товара. Это позволяет сделать объявления более заметными и привлекательными для потенциальных покупателей.
- Нейро-подсказки в мессенджере. Во время переписки с покупателями система будет предлагать готовые формулировки ответов, ускоряя диалог и помогая сторонам быстрее договориться о сделке.
- Нейро-ассистент для продавцов. Модель может полностью взять на себя коммуникацию в чате: автоматически отвечает на типовые вопросы о наличии, характеристиках товара и условиях сделки — даже когда продавец оффлайн.
- Нейро-отзывы. Автоматически формирует краткий и понятный пересказ отзывов, собранных от разных пользователей, помогая быстро оценить уровень сервиса и качество услуг исполнителя.
- Мульти-объявления. Система умеет извлекать параметры товаров из текста объявления и объединять похожие товары в одно объявление с разными вариациями — например, по цвету, размеру или комплектации.
- Нейро-теги для поиска. Алгоритмы анализируют фото и текст объявления, автоматически определяют ключевые характеристики товара и присваивают им теги. Даже если пользователь не указал эти параметры вручную, теги помогут системе показать объявление в релевантных поисковых запросах и повысить его видимость.
На 2025 год запланировано внедрение еще порядка 20 сценариев использования.
«Мы входим в небольшое число российских компаний, разрабатывающих собственные генеративные модели. Наша глобальная цель – трансформировать с помощью GenAI классифайд-платформу в интеллектуального ассистента для миллионов продавцов и покупателей», – говорит Андрей Рыбинцев, старший директор по данным и аналитике Авито.
Как обучали модели
Модели разработаны на базе нейросети Qwen2.5 с 7 миллиардами параметров и адаптированы под задачи, связанные с покупкой и продажей. Для обучения использовался массив данных объемом более 10 терабайт — в него вошли как открытые источники, так и собственные обезличенные данные Авито. Для обучения диалоговых сценариев была подготовлена собственная выборка синтетических данных – специально написанных примеров общения между продавцами и покупателями.
Текстовая модель A-Vibe работает с языком и отвечает за генерацию описаний, отзывов, рекомендаций и сообщений. Одним из ключевых технологических решений стало создание собственного русскоязычного токенизатора, которым заменили исходное решение. В отличие от англоязычных токенизаторов, используемых в большинстве моделей с открытым кодом, он позволяет быстрее и точнее обрабатывать русский текст — скорость генерации увеличена до двух раз по сравнению с рыночными аналогами.
Мультимодальная модель A-Vision обрабатывает как текст, так и изображения. Она умеет распознавать текст на фото, анализировать визуальные характеристики товаров, оценивать качество изображений и модерировать визуальный контент. Эта модель может найти применение в сценариях, где важна визуальная составляющая — например, при размещении объявлений, поиске по фото и автоматической модерации.
Подготовка кадров
Для масштабного внедрения GenAI Авито развивает собственную систему подготовки кадров. В 2024 году компания запустила магистратуру по Data Science в МФТИ, а в 2025 году откроет еще три образовательные программы — в ВШЭ и ИТМО. Обучение пройдут 140 студентов, из которых 118 будут учиться за счет компании.
Авито также планирует получить образовательную лицензию и создать собственный центр дополнительного образования. Базой для него станет Академия аналитиков, действующая с 2020 года и уже подготовившая 153 специалиста.
Читать первым в Telegram-канале «Код Дурова»