Кодик кратко объясняет суть статьи
На Inside AI Meetup эксперты из RWB, Сбера, Альфа-Банка и других компаний обсудили реальные вызовы внедрения ИИ в промышленных масштабах, отойдя от хайпа вокруг генеративных моделей и фокусируясь на практической ценности, экономике и инженерной зрелости. Главный тезис — ИИ не должен внедряться ради ИИ: его применение оправдано только тогда, когда он решает конкретную бизнес-задачу эффективнее эвристик или классических систем. Компании подчёркивают важность оценки полной стоимости владения (TCO): инференс, инфраструктура, поддержка, мониторинг и риски. Внедрение ИИ — это не запуск модели, а построение всей системы вокруг неё: контекста, контроля, маршрутизации, инструментов и ответственности. Успех зависит не от мощи модели, а от «контуров» — архитектуры, данных и интеграций. Многие задачи, особенно с чёткими правилами, эффективнее решать классическими методами. ИИ оправдан там, где данные слишком сложны или объёмны для ручного анализа, но даже там решение может перейти к эвристикам после выявления паттернов. Красные флаги — ожидание 100% точности и восприятие ИИ как «серебряной пули». Важную роль играют невидимые для пользователя сценарии: прогнозирование спроса, логистика, модерация, документооборот. Например, в Альфа-Банке автоматизация кредитных договоров сократила цикл с 8 дней до одного, а обработка документов снизила затраты на 50%. Экономика остаётся ключевым фактором: многие прототипы не масштабируются из-за высокой стоимости инференса и поддержки. Однако участники отмечают, что цена ИИ-решений снижается, и сегодняшние убыточные проекты могут стать рентабельными в будущем. Главное — развивать компетенции уже сейчас, чтобы не отстать. Эксперименты с ИИ — это инвестиция в будущее, даже если текущая экономика не сходится.
Содержание
Читайте в Telegram
|
Пока публичная дискуссия об ИИ всё ещё часто крутится вокруг вау-демо, генерации картинок и разговоров о замене людей, в продакшене вопросы давно другие: сколько стоит инференс, как не уронить сервис на пике, где нейросеть действительно лучше эвристики и кто отвечает, если модель ошиблась.
Именно об этом говорили на Inside AI Meetup, где RWB собрала команды, которые внедряют ИИ не в презентациях, а в сервисах с миллионами пользователей — маркетплейсах, банковских продуктах, модерации, поиске, рекомендациях и инфраструктуре.
Рассказываем подробнее — в специальном репортаже «Кода Дурова» с мероприятия.
ИИ не ради ИИ
Митап открыл Павел Раваев, директор по данным RWB. Его выступление стало рамкой для всей программы: он сразу отделил хайп от реальности и сформулировал главный принцип — не внедрять ИИ ради ИИ.
По словам Раваева:
- Нейросети — это не волшебная таблетка, а инженерный инструмент. Поэтому правильный вопрос внутри компании звучит не «куда бы прикрутить нейросеть», а «какую реальную задачу она решит лучше, чем эвристика или классическая автоматизация».
- В RWB ежедневно проверяют десятки и сотни гипотез. Часть из них не доходит до внедрения — и это нормальный результат. Иногда оказывается, что алгоритмы дешевле, надёжнее и понятнее, чем сложная ML-система. В этом и заключается зрелый подход: уметь сказать ИИ «нет», если задача не требует нейросети.
- Еще один важный принцип — экономика в продакшене. Красивая демо-метрика может разбиться о реальность: стоимость GPU, инференс на пиках, мониторинг, откаты и поддержка. Поэтому любой ИИ-продукт оценивается с двух сторон: даёт ли он пользовательскую ценность и сходится ли его экономика на масштабе.

При этом компания готова делиться измеримыми результатами. Например, поиском по фото пользуются 1,7 млн человек в день, а генеративные инструменты для продавцов помогли улучшить более 3 млн карточек товаров.
Но значительная часть ИИ-сценариев остаётся невидимой для пользователя. Это прогнозирование спроса, оптимизация поставок, маршрутизация на складах и другие процессы, которые не выглядят как «вау-фича», но напрямую влияют на эффективность бизнеса.
Раваев подчеркнул: внедрение ИИ в production на большом масштабе — это постоянные компромиссы, ограничения и инженерный вкус.
Как ИИ живёт в реальных продуктах
Почти каждый спикер по-своему подтверждал общий тезис: настоящая работа с ИИ начинается там, где заканчивается красивая демонстрация.
Руководитель ML-платформы Даниил Понизов и MLOps-инженер Роман Лазовский из RWB рассказали о внедрении AIOps-практик для контроля и повышения утилизации ресурсов. Это важная тема для компаний, которые эксплуатируют не один экспериментальный сервис, а тысячи продуктовых систем, включая ML- и GenAI-нагрузки.

В промышленном ИИ вычислительные ресурсы быстро становятся отдельной статьёй расходов. Поэтому важно не только обучить модель или запустить сервис, но и понимать, как используются кластеры, как обрабатываются алерты, где простаивают мощности и как быстро команда реагирует на инциденты.
В RWB для этого внедрили AIOps-платформу KeepHQ. По словам спикеров, она помогла повысить утилизацию ресурсов ресерч-кластера и сотен production ML-сервисов в 1,5 раза, а также автоматизировать процесс реагирования и контроля разрешения алертов.
Другой пример практического ИИ — в видеошоппинге Wibes. Антон Костин и Виталий Подобедов рассказали о сервисе, который генерирует тексты и теги напрямую из аудио-визуального контента. Это нужно потому, что авторские описания видео часто бывают субъективными или недостаточно точными.
Такая «отекстовка» видеопотока используется не только для красивых описаний. Она помогает в поиске и определении тематик каналов. То есть модель становится частью инфраструктуры платформы: она помогает лучше понимать контент, который загружают пользователи.
Один из самых технических докладов был у Льва Нечаева, руководителя команды автоматической модерации методами ИИ в RWB. Он рассказал, как векторный поиск используется в модерации контента и как более 200 моделей можно собрать в один ансамбль.
Векторный поиск здесь выступает элементом 2-stage модерационных моделей. Он помогает снижать time to market модерации без дополнительного обучения моделей. Нечаев показал путь от первых моделей до универсальных детекторов на основе векторного поиска, а также разобрал сложности сбора данных и реализации высоконагруженных детекторов.
Нечаев подчеркнул, насколько далеко ушла модерация от простого представления «модель проверяет картинку или текст». В реальности это сложная система, где разные детекторы смотрят на объект под разными углами, а скорость внедрения новых сценариев становится критичной для бизнеса.
Юрий Софронов из RWB продолжил эту линию уже на примере LLM-продуктов. Его доклад был посвящён тому, что на самом деле представляет собой запуск решений на базе больших языковых моделей.

Со стороны может казаться, что всё просто: взять open-source-библиотеки, настроить промпты и прокинуть API до LLM. Но в реальном продукте за этим стоит гораздо больше: интеграции, пайплайны, ограничения, тестирование, эксплуатация, оценка качества и понимание того, что точно не стоит делать.
В докладе были разобраны тонкости работы с данными, которые формируют необходимый для модели контекст, важность их подготовки для LLM и то, как они могут влиять на качество вашего сервиса; почему выбрать правильный стек технологий для таких продуктов так же важно, как и хорошую модель, и как в RWB ускоряют работу LLM в проде при помощи не самых очевидных подходов.
Именно это стало одной из центральных мыслей митапа. LLM-продукт — это не модель сама по себе, а вся система вокруг неё. Контекст, инструменты, маршрутизация, контроль качества и ответственность за результат часто оказываются важнее, чем выбор конкретной модели.
Где ИИ действительно нужен
Завершилась программа панельной дискуссией Inside AI, в которой приняли участие эксперты из Альфа-Банка, Сбера, red_mad_robot и RWB.
Главный вопрос дискуссии звучал так: где проходят границы между LLM, ML и классической автоматизацией — и какие решения действительно работают.

Руководитель направления Supply and Demand Balance (DS & ML) RWB Михаил Дьячков предложил обсуждать ИИ как инженерный и бизнес-инструмент. По его словам, ключевой вопрос промышленной разработки систем машинного обучения заключается не в том, можно ли использовать ИИ, а в том, даёт ли это реальный экономический и продуктовый эффект. Важно учитывать TCO, риски масштабирования и то, кто отвечает за инциденты в продакшене.
Первый тезис дискуссии, сформированный Михаилом Дьячковым, был провокационным: половине ИИ-функций искусственный интеллект не нужен.
Product lead платформы моделей омнимодальности в блоке развития генеративного ИИ Сбера Артем Аюпов согласился с этим и отметил, что многие компании внедряют ИИ по указанию сверху, не всегда понимая задачу. Если границы сценария чёткие, простая логика часто выигрывает у нейросети. По его словам, ИИ хорошо работает в копирайтинге, кодинге, вайб-кодинге и дизайне, но в некоторых областях, например кибербезопасности, классические классификаторы могут быть эффективнее LLM.
Директор департамента защиты от DDoS-атак RWB Алексей Медошин привёл похожий пример из AntiBot и Antiddos, где многие задачи решаются эвристиками. ML становится оправданным, когда данных настолько много, что аномалии невозможно выявить визуально или простыми скриптами. Но после того как паттерн найден, решение снова может уйти в эвристику.
Руководитель отдела пилотных проектов на базе генеративного ИИ в Альфа-Банке Ксения Михайлова рассказала, что компания подходит к ИИ как к элементу корпоративной инфраструктуры. Банк внедряет решение с ИИ, когда чётко понимает его эффективность в новых условиях и видит, где оно действительно улучшает показатели бизнеса.
Участники также обсуждали «красные флаги» ИИ-проектов. Один из главных — восприятие ИИ как «серебряной пули», которая способна решить любую проблему бизнеса.
Если на входе хаос, на выходе тоже будет хаос. Другой красный флаг — требование 100% качества: ИИ не может его гарантировать, а в некоторых сценариях ошибка модели обходится слишком дорого.
При этом не все задачи требуют стопроцентной точности. В поддержке клиенту часто достаточно решить проблему, даже если ответ сформулирован не идеально. Но в налоговой отчётности или финансовых расчётах цена ошибки может быть слишком высокой.
Дополнительно Ксения Михайлова прокомментировала, что до продакшена доходят только лучшие идеи — Альфа-Банк отсеивает до 70-80% пилотов на этапе оценки экономики и рисков. Там, где компания видит реальную ценность, быстро масштабируется. Например, AI-документооборот: автоматизация формирования кредитных договоров сократила цикл с 8 дней до одного, а агенты по обработке 800 типов документов снизили операционные затраты на 50%.
Не модель, а контур вокруг неё
Второй крупный блок дискуссии был посвящён агентам, GenAI и автоматизации.
Здесь участники сошлись в том, что ценность агентных систем не столько в автономности, сколько в управляемой обвязке: бизнес-правилах, инструментах, маршрутизации и контроле человека.
На вопрос, что важнее в LLM — модель или контуры вокруг неё, все участники ответили коротко: конечно контуры.
Android Team Lead WB Partners Александр Гирев подтвердил это на примере локальных LLM: без правильной обвязки модель плохо поддерживает длинный агентский цикл и не всегда понимает, когда задача завершена. Более сильная модель после настройки справляется лучше, но всё равно требует донастройки под конкретный сценарий.
Артем Аюпов сформулировал один из ключевых сдвигов последних месяцев: рынок переходит от промпт-инжиниринга к системному инжинирингу. Важен уже не только промпт, а то, как построен контекст, какие инструменты доступны модели, как организована оркестрация и какие ограничения заданы системе.
AI Lead и архитектор AI/ML-решений red_mad_robot Даниил Поляков отдельно отметил роль DWH и бизнес-контекста в читаемом для LLM виде. Например, в копилоте аналитика модель может галлюцинировать при расчёте выручки, если её не направлять правильной обвязкой и маршрутизацией. То есть нужен не только «ум» модели, но семантический слой для понимания бизнес-контекста организации.
При этом участники не сводили всё только к большим фронтальным кейсам вроде чат-ботов. Напротив, много пользы может быть в невидимых сценариях — логистике, складах, антиботе, обработке отзывов, внутренних инструментах для аналитиков и точечных решениях для команд.
Алексей Медошин привёл хороший пример: антибот, который пропускает пользователя без капчи, остаётся незаметным для клиента. И это как раз хорошо. Если пользователю приходится проходить капчу из-за решений ML-моделей, UX уже ломается.
Поляков также отметил, что много денег может быть в «не секси»-нишах: автоматизации работы с договорами, тендерами, в строительной и добывающей нишах, на производствах и с внутренними операционными процессами компаний. В таких задачах AI и ML могут давать проценты эффективности, что может не выглядеть «вау», но в абсолютных значениях экономический эффект может идти на десятки и сотни миллионов рублей из-за большой экономической значимости оптимизируемого процесса.
Экономика всё равно догонит
Отдельная часть дискуссии была посвящена экономике, инфраструктуре и продакшену. Михаил Дьячков сформулировал следующий тезис:
Многие ИИ-фичи доходят до прототипа, но при масштабировании упираются в стоимость железа, инференса, команд и поддержки.
Алексей Медошин сформулировал подход через безопасность: нужно сравнивать стоимость атаки, стоимость защиты и возможный ущерб. Если защита (ИИ-фича) стоит дороже всего остального, то возможна она и не нужна.
Артем Аюпов говорил о необходимости считать юнит-экономику до запуска. Иногда работает простой фильтр: попросить заказчика принести фактуру и обосновать эффект. Если он не возвращается, значит задача, вероятно, не так уж нужна.
Ксения Михайлова признала, что экономика не всегда сходится идеально, особенно на ранних этапах. Но многое зависит от позиции руководства: если есть вера и готовность инвестировать в направление, компания может позволить себе больше экспериментов.
Даниил Поляков добавил важный нюанс: нужно смотреть не только на текущую экономику, но и на динамику. Стоимость инференса и токенов снижается, поэтому то, что не сходится сегодня, может стать рентабельным через полгода. Кроме того, есть стоимость неделания — важно нарабатывать компетенции и опыт в AI уже сейчас, не дожидаясь идеальных условий, иначе велик риск технологического отставания из-за позднего старта.
Это, пожалуй, один из самых ёмких выводов всей дискуссии:
Внедрение ИИ — не бинарный выбор между «дорого» и «дёшево». Это работа с неопределённостью: нужно считать деньги, но также понимать, какие компетенции компания потеряет, если вообще не будет экспериментировать.








