Зачем компания развивает собственное семейство больших языковых моделей (LLM), как искусственный интеллект защищает клиентов банка от мошенников и стоит ли людям опасаться, что ИИ займет их рабочее место.
Основное из интервью директора по ИИ Т-Банка для Kept.
Большую модель можно сравнить с огромным неповоротливым мозгом
«Действительно, вокруг больших языковых моделей в мире возник некоторый пузырь. Люди слишком верили в технологию и вложили в нее слишком много денег и усилий, а отдача от инвестиций получилась не такой значимой, и акции многих компаний начали падать.
Большую модель можно сравнить с огромным неповоротливым мозгом. Во время работы она съедает много ресурсов и поэтому очень тормозит. Небольшие модели под конкретные задачи работают быстрее, и стоимость на единицу запроса тоже значимо ниже».
Не создавать технологию ради технологии
«Мы точно не хотим создавать технологию ради технологии и строить большую базовую модель (foundation model), которая умеет решать множество задач, потому что для нас как для бизнеса это бессмысленно. Нам не нужна модель, которая, например, решает ЕГЭ или юридические тесты.
Мы понимали, что у нас есть определенное количество доменных областей, по-простому — сценариев, и понятные задачи в этих доменных областях. Решить эти задачи проще, чем сделать одну огромную модель, которая хорошо решает все: разница в затраченных ресурсах больше чем 10 раз. В результате мы делаем не одну модель, а семейство моделей, каждая из которых заточена под свою доменную область и ее результат в конкретной области превосходит результат большой модели и по качеству, и по возврату инвестиций.
У нас есть достаточно устойчивая финансовая модель, как с лихвой окупать все наши инвестиции в большие языковые модели. Этим мало кто сейчас может похвастаться».
У кого самый большой и умный искусственный интеллект
«Обычно все пытаются построить большую модель и еще помериться с другими, насколько у них большой и умный по всему спектру задач искусственный интеллект. Мы такую задачу себе не ставим, потому что это бессмысленно. Другие компании тоже начинают это понимать и разрабатывать заточенные под конкретные задачи решения.
Если посмотреть, что делают крупные компании на основе огромных моделей, станет ясно, что они пытаются дистиллировать модели — создавать маленькие и более эффективные модели из больших. Мы этот этап уже прошли. Все компании идут примерно к одному, копая этот тоннель с разных сторон. Индустриальные модели начнут появляться, просто это займет время».
ML подает сигнал — появляется понятный набор проблем для работы
«У нас есть два больших направления работы. Первое — сделать какой-либо процесс в компании лучше, быстрее или за меньшие деньги. Например, повышение эффективности сотрудников — одна из самых плодотворных областей с точки зрения возврата инвестиций. В службе поддержки, продажах и операционной деятельности банка можно многое оптимизировать благодаря большим языковым моделям.
Вторая большая область — это пользовательский опыт. Его часто упускают из виду, потому что невозможно напрямую оценить, сколько денег принесет улучшение пользовательского опыта. Но Т-Банк — компания продуктовая, и мы хотим делать лучшие продукты для наших клиентов. Это сфера, где за счет технологического рычага можно сильно продвинуть пользовательский опыт. Умные ассистенты, более умный поиск, речевые сервисы, которые позволяют людям лучше взаимодействовать с нашей экосистемой или с внешним миром, например секретарь, который отвечает на звонки.
Мы используем технологию машинного обучения и из всего массива информации извлекаем ценный сигнал: на что жалуются люди, что плохо сделано. Далее мы сообщаем продактам, что именно людям нравится или не нравится, и у каждого продакта появляется понятный набор проблем для работы. То есть мы доводим это вплоть до изменения в конечном продукте. Это довольно ценная часть работы Центра искусственного интеллекта. Для нас самое главное — выстроить долгосрочные отношения с пользователем и помогать ему лучше решать ежедневные задачи».
«Вася и Петя самые главные и принимают решения» — это очень далеко от того, как устроен Т-Банк
Очень важно создать креативную среду из продактов, разработчиков, инженеров, которые обмениваются мнениями, благодаря чему вспыхивают идеи и затем вырастают в конечный продукт. При такой культуре и степени свободы количество идей, которые дошли до результата, значимо больше, чем при вертикальной структуре с командиром, который говорит: „Это делаем, а это — нет“. Мы стараемся поддерживать горизонтальную структуру, поэтому у нас много умных ребят с высокой насмотренностью.
Проблемы с тем, что у нас огромное количество идей и их надо фильтровать, нет. Потому что в Т-Банке challenge-среда. Идеи подвергаются достаточно жесткой калибровке. Когда кто-то приходит с идеей, его сразу закидывают вопросами: какой будет возврат инвестиций и точно ли это нужно пользователям, давай проведем исследование? Мы за data-driven-подход и привержены подтверждать идеи данными — это базовый фильтр. И когда идея доходит уже до определенного уровня, например до меня, скорее всего, она уже прошла через тернии, подкреплена данными и обрела сторонников».
Защищаем людей от мошенников
«Наш фокус — защитить пользователя от всевозможных мошеннических угроз. Некоторые из них проще предотвратить, а борьба с другими требует технологий с очень высоким уровнем распознавания речи и большим корпусом данных, чтобы выявлять мошенников.
Например, иногда нужно быстро понять, что звонит мошенник, и обрубить звонок. Мы уже это делаем. Защиту такого уровня может позволить себе довольно небольшое количество игроков.
Также, думаю, мы хорошо видим тренды в мошенничестве и риски будущего. Например, текущий вектор опасности связан с видеокружочками в мессенджерах. Мы достаточно давно знали, что это произойдет, потому что следим за технологиями и знаем, на какой стадии сейчас синтез видеоизображений и фейковых видео. Мы понимали, что это вопрос времени, когда этим воспользуются мошенники, и заранее подстелили соломку — понимаем, каким образом защищать пользователей».
Зачем банку лаборатория для исследований ИИ
«В сфере ИИ нужно быть на фронтире. Мы делаем вещи такого уровня сложности, где нет готовых решений, — нельзя просто прочитать статью и пойти воспроизвести. Например, компания OpenAI выпускает модели и не рассказывает, как они это сделали, — есть результат, но нет методички. Многие вещи приходится додумывать самим. Большую часть работы, которую выполняют ребята, мы применяем в индустриальных решениях.
Наша команда исследователей очень успешна, публикует и представляет научные статьи на больших международных конференциях — мы являемся одним из двигателей мировой науки. Одновременно благодаря большой научной команде растет и наш статус в сообществе. Плюс наука сильно переплетена с образованием, и мы достаточно сильно вовлекаемся в выращивание специалистов в области ИИ».
ИИ не конкурент человеку, а помощник
«„Оптимизация работы сотрудников“ — звучит страшно. Но фактически задача — дать инструмент, чтобы людям было проще выполнять свою работу.
Объясню на примере автопилотирования автомобилей. Есть шесть градаций: на первом этапе автопилот просто сигнализирует, что ты уходишь с полосы, а на последнем ты можешь сидеть на пассажирском кресле, а машина едет сама. И между этими крайностями множество градаций. Когда мы создаем решения в помощь сотрудникам, мы не с последнего начинаем. На первом этапе инструменты дают подсказки, потом предлагают определенные шаги, и только на высших уровнях решение выполняет бо́льшую часть работы за человека, а он лишь подтверждает. Есть огромный барьер между первым и высшим уровнем, и мало какая индустрия его прошла. Большая часть всей работы происходит на первых пяти этапах.
Поэтому профессионалам бояться довольно странно. Эти инструменты помогут выполнять работу быстрее и лучше.
Показательная история — про генерацию изображений. Когда появился Midjourney, художники протестовали. А потом компания Adobe интегрировала в Photoshop генеративные инструменты, которые позволяли дорисовать картинку и все такие: „Вау, крутая штука!“ — прекратили протесты и начали применять эти инструменты. Думаю, так произойдет со всеми индустриями: появляются решения, благодаря которым профессионалы будут лучше выполнять свою работу».
Полное интервью доступно по ссылке.
Читать первым в Telegram-канале «Код Дурова»