«Алгоритмы рекомендаций научатся понимать сарказм и учитывать настроение пользователя»: интервью с руководителем рекомендаций VK

Рекомендательные алгоритмы учитывают множество аспектов — от настроения пользователя и актуальных трендов до контекста просмотра.

Через несколько лет они научатся распознавать в контенте тонкий юмор, чувства и переживания, делая выдачу в лентах более персонализированной.

Об этом и многом другом в интервью «Коду Дурова» рассказал руководитель направления рекомендаций AI VK Андрей Зимовнов.



— Привет! Как сегодня трансформируются подходы к разработке рекомендательных систем, их метрики успеха и роль в индустрии?

— Привет! Рекомендательные системы есть фактически в каждом цифровом продукте: от контентных сервисов до маркетплейсов и банковских приложений. В VK подход к развитию рекомендательной системы идентичен подходу к разработке отдельного продукта, у которого есть свои свойства и акторы – группы со своими интересами и ожиданиями. Обычного пользователя или автора контента интересует насколько система учитывает его личные предпочтения, текущие события и даже настроение.

Поэтому можно назвать пять характеристик рекомендательной системы.

Во-первых, актуальность. Как я уже говорил, в ленте должен быстро появляться трендовый и актуальный контент. Например, популярные треки или сезонные тренды.

Во-вторых, реактивность, то есть насколько быстро алгоритм адаптируется к новым интересам пользователя.

Третье — контекстность: не только общие предпочтения, но и обстоятельства, в которых находится человек. Время, настроение, ситуация вокруг. Например, утром по пути на работу нам актуальна динамичная музыка, а под конец дня — спокойная.

Четвертое — умение вывести пользователя из привычного информационного пузыря и предложить новое. Например, любителям хайкинга показать контент про сплавы и рыбалку.

Пятое — стандартные для рекомендательных систем метрики вовлечённости аудитории: лайки, комментарии, шеры. Такие сигналы становятся фундаментом для улучшения других характеристик и метрик рекомендаций.

— Какую конечную цель вы ставите перед рекомендациями?

— Сделать сервисы и продукты максимально персонализированными. Учитывая количество сервисов в VK, большое количество данных, рекомендации должны быть экосистемными. Поэтому мы запустили Discovery-платформу, которая формирует точные профили интересов каждого пользователя, исходя из истории его взаимодействия с контентом на разных площадках. На базе этой платформы строятся как рекомендательные алгоритмы, так и поиск, и реклама.

— То есть у поиска, рекламы и рекомендаций одна общая задача?  

У поиска, рекомендаций и рекламы очень схожие задачи. В конечном итоге во время просмотра ленты или поиска, пользователь должен быстро увидеть искомое и удовлетворить свой запрос. При этом его раздражают неактуальные рекламные баннеры, в то время как рекламодатели хотят точечно попадать в свою целевую аудиторию.

Когда речь идёт о крупных социальных и контентных площадках как в VK, где есть разнообразные продукты, решать эти задачи нужно централизованно.

— Что важнее для рекомендательной системы: увеличить время пользователя в сервисе или, наоборот, быстрее удовлетворить его потребность?

— Вопрос не совсем корректный. Раньше в индустрии главным показателем работы рекомендаций было именно время, проведённое на площадке. Мы двигаемся дальше, поэтому развиваем разные свойства рекомендаций, которые отличаются от продукта к продукту.

Иногда улучшение качества рекомендаций, то есть точное попадание в сиюминутный интерес пользователя, может снижать time spent (Проведённое время — Прим. «Кода Дурова») и это нормально, если растут долгосрочные метрики: возвраты, количество сессий, лояльность.

— Какой должна быть идеальная рекомендательная система: быстрой или долгоиграющей?

— Идеальный баланс в каждом продукте свой. Например, в VK Клипах пользователи за сессию успевают посмотреть много коротких роликов и очень часто находят новый краткосрочный интерес, который важно хорошо исследовать в этой же сессии. А в VK Видео, где в основном длинные видео, важно хорошо учитывать долгосрочные интересы, там пользователи детально подходят к выбору контента.

Важно при выстраивании рекомендаций в продукте ориентироваться не только на time spent. В краткосрочной перспективе долгая прокрутка ленты может принести дополнительные минуты на площадке, но в долгосрочной выигрывает рекомендательная система, за которой охотнее возвращаются.

— А количество скроллов считается?

Конечно, но мы это называем «скипы» — быстрые пролистывания контента, который пользователь отвергает за секунды. Это одна из метрик качества рекомендаций и значимый сигнал для алгоритмов.

— Что важнее — лояльность пользователя или доход от дополнительных рекламных показов?

— Приоритет — качество пользовательского опыта. Даже если эксперимент с рекомендательными алгоритмами дает рост дохода, но, например, вызывает всплеск дизлайков, он считается неудачным. Важно не жертвовать долгосрочной лояльностью пользователей ради краткосрочной выгоды.

— Сегодня много говорят о мультимодальных моделях, которые понимают контент «как человек». Улавливают ли они сарказм, иронию или специфический контекст внутри роликов?

— Не все люди понимают сарказм и иронию, поэтому для рекомендаций это тоже непросто. Но есть мультимодальные модели, которые улавливают в контенте тонкие смыслы. Они анализируют не просто тексты, речь и кадры, но и настроение высказывания и эмоциональный окрас. Рекомендации VK основаны как раз основаны на таких технологиях глубокого понимания контента. В какой-то перспективе алгоритмы рекомендаций научатся понимать и сарказм.

— Многие говорят, что рекомендации VK хуже, чем у YouTube. Так ли это? И копируете ли вы подходы конкурентов?

— Сравнивать рекомендации разных платформ довольно сложно: нет общепринятых открытых бенчмарков, а у сервисов отличаются аудитория, форматы контента, сценарии потребления и даже цели продукта. То, что выглядит “лучше” субъективно, может в измеримых метриках показывать что-то другое.

Мы в VK оцениваем рекомендации по набору характеристик, о которых я ранее рассказывал. За год мы сильно прокачали релевантность и вовлечённость благодаря единой Discovery‑платформе: год к году выросло время просмотра VK Клипов почти на 20%, количество сохранённых треков в VK Музыке — на 40%, релевантность рекомендуемых роликов в VK Видео почти в полтора раза, а число подписок на авторов из ленты ВКонтакте— на 43%. В будущем году мы сосредоточимся на реактивности и актуальности, чтобы лента быстрее подстраивалась под пользователя и в ней было легче находить трендовый контент.

Что касается «копирования» подходов, то рекомендательные системы невозможно просто заимствовать или перенести один к одному. Мы, безусловно, внимательно следим за развитием индустрии и научными публикациями, но проектируем технологии с учётом собственных форматов, экосистемного контекста и реальных сценариев пользователей и авторов VK. Например, задачи роста и поддержки авторов-новичков почти не представлены в открытых исследованиях, и здесь мы во многом опираемся на собственный оригинальный ресёрч. Для нас как для экосистемы принципиально важно не только рекомендовать контент, но и помогать креаторам развиваться и находить новую аудиторию.

— Сколько авторов у VK?

— Авторов, которые целенаправленно развивают сообщества и аккаунты, миллионы, например, во Вконтакте их около 22,5 млн (по данным Brand Analytics и соцсети). Но на самом деле каждый пользователь — потенциальный автор. Мы развиваем механики, помогающие авторам-новичкам находить релевантную им аудиторию.

— Какой тренд в рекомендательных системах оказался переоценённым?

— Я бы назвал Reinforcement Learning. Это подход к обучению, при котором модель не опирается на заранее подготовленный набор правильных ответов. Вместо этого она взаимодействует со средой: выполняет действия и получает отклик от человека или алгоритма. Если поведение приводит к желаемому результату, модель получает «вознаграждение» и усиливает стратегии, которые к нему привели. Если результат нежелательный, модель сталкивается со «штрафом» и корректирует параметры так, чтобы избегать подобных ошибок в будущем. Уже много лет его пытаются применять в рекомендациях, но значимых практических улучшений пока нет. В других областях, например, в дообучении LLM, он работает хорошо, но в рекомендациях пока переоценён.

— Что станет следующим прорывом в рекомендациях?

Рекомендации станут диалоговыми. Пользователь может просто написать или сказать: «Давай что-нибудь лёгкое на вечер», «Я устал от футбольных обзоров», «Хочу посмотреть крутой боевик». Такая форма рекомендаций соединит мощные языковые модели, мультимодальные представления и глубокие знания об интересах пользователя. Мы исследуем, как сделать такое взаимодействие максимально естественным и комфортным.