Андрей Белевцев на GigaConf 2025: как Сбер запускает новую эру разработки благодаря генеративному ИИ
«Код Дурова» продолжает свою работу на IT-конференции Сбербанка GigaConf 2025. В этом интервью у нас в гостях старший вице-президент, руководитель блока «Технологическое развитие» Сбера, Андрей Белевцев.
В рамках беседы узнали, как генеративный ИИ трансформирует рабочие процессы в российских компаниях, о подходе Сбера к развитию нейросетевой модели GigaChat, её роли в госсекторе, вызовах, внедрении ИИ и будущем инженерных профессий. Также Белевцев поделился мыслями о конкуренции с мировыми лидерами и перспективах для молодых разработчиков.
Видеоверсия интервью:
— Основной темой GigaConf этого года стали генеративные нейросети, генеративный искусственный интеллект и всё, что с этим связано. По твоему мнению, насколько генеративный искусственный интеллект сейчас изменил рабочие процессы в целом в компании?
— Я считаю, что он очень сильно влияет. Два года назад мы делали первые шаги, когда мы внутри компании начали предлагать разработчикам работать вместе с «AI-копайлотами», начиная с самых простых сценариев. И мы видели вот эту кривую обучения и восприятия. Мы, конечно, прям совершенно осознанно никого ни на что не заставляли. Мы предлагали, мы рекламировали, но никакого не было пуша. Прошло где-то 9 месяцев, прежде чем мы увидели, что из экспериментов люди действительно стали это воспринимать серьёзно и активно. А сейчас больше 90% наших разработчиков обязательно работают с использованием моделей GigaCode в своей работе, это стало абсолютным стандартом. Мы их интегрировали в IDE, на которую активно переходим, GigaIDE, тоже доступна сейчас всем компаниям на рынке. По нашим оценкам, порядка 14% российских разработчиков уже на неё перешли и пользуются. И мы ведем её развитие с двумя акцентами. Во-первых, это семейство: чтобы у тебя был облачный IDE и чтобы у тебя был десктопный IDE. Второе, мы активно работаем, чтобы были все нужные корпоративные плагины. И третье, конечно, мы хотим делать её нативной средой для работы с агентами-помощниками. В основе мы используем наиболее популярные в разработке среде open-source проекты, но фокусируемся не на базовой функциональности, а на том, чего сейчас в них не хватает.
— Сегодня GigaChat, нейросеть от Сбера, можно назвать универсальным решением для решения многих задач. Как ты оцениваешь внедрение подобных нейросетей и вообще в целом всех этих технологий в процессы в компании, в государственное управление. Насколько ты видишь перспективы в этом направлении? Считаешь ли ты, что эта история каким-то образом может повлиять на дальнейшее развитие инженерных кадров?
— Во-первых, GigaChat – это не просто нейросеть. На самом деле под словом GigaChat сейчас уже скрывается целое семейство фундаментальных моделей, обладающих широким набором характеристик. Если посмотреть на такие foundation models, наши модели уже сейчас понимают аудио. То есть она не только слышит, о чём мы сейчас с тобой говорим – она в принципе слышит, что происходит вокруг, способна это интерпретировать в комплексе. Это очень сильно отличается от стандартных speech-to-text моделей, которые при переводе звука в речь всю остальную информацию откидывают. Здесь все гораздо шире, она поймет, что разговаривали два человека, сделает предположение о том, кто мы, даже о нашем возрасте, о настроении и т.д. Прямо как мы понимаем кроме аудио, изображение, мы понимаем естественный текст, код.
С другой стороны, сама модель способна с помощью инструментов, она может не только генерировать ответ в виде текста или кода, она способна, используя инструментарий, создавать картинки, использовать инструменты поиска, делать вызовы API других приложений. И все вместе мы сейчас смотрим на неё не просто как на отдельную модель, а как на платформу, на базе которой ты можешь из облака или внутри твоего корпоративного ландшафта on-premise строить сложные кейсы, которые станут частью твоих бизнес-процессов. И для нас это очень важно. С этой точки зрения такое предложение на сегодняшнем российском рынке уникально по сочетанию характеристик.
Дальше вопрос, как это внедряется и что это меняет. Вот сегодня в Сбере мы видим сотни инициатив, которые прорастают по всей компании, потому что, конечно, мы очень стараемся, чтобы весь этот инструментарий был доступен каждой нашей продуктовой команде. Именно она ближе всего к своему клиенту, взаимодействует с ним через свой продукт и понимает, в каких сценариях наиболее приоритетно создавать изменения, внедрять агенты на основе генеративного искусственного интеллекта, которые сделают клиентский опыт лучше или обслуживание интереснее, или предложит клиенту принципиально новый продукт. В этом смысле мы думаем, что не будет ни одного продукта, куда эта технология не придёт.
Человек уже начинает воспринимать GigaChat как своего AI-помощника, у нас сейчас есть наша основная поверхность Giga.chat. Это веб-приложение, которое удобно сделано для того, чтобы организовать работу и с мобильного, и с десктопа, потому что мы видим, что люди идут туда как в регулярных ежедневных сценариях. Например, найти ответ на вопрос, сделать анализ, провести какое-то исследование, так и все больше начинают использовать его в сценариях личной продуктивности. 40% аудитории GigaChat регулярно используют умный редактор, который мы там сделали, для того, чтобы там создавать или анализировать рабочие документы, или проводить исследования вместе со своими AI-агентами.
Теперь переходя к госуправлению. Мне кажется, что будущее госуправления в определенной степени – это когда государство даёт гражданину все услуги государства. И в этом смысле, как мне кажется, человеку все государственные услуги тоже должны быть доступны через его AI-помощника. Мне кажется, что эпоха, когда за каждую услугу надо было мне куда-то сходить, она, конечно, уходит.
— Я как активный пользователь GigaChat могу подтвердить все то, что ты сказал до этого. У меня вопрос следующий: вот ты сказал о преимуществах внедрения подобных технологий и в компаниях, в бизнесе, и в госуправлении, даже для каждого человека в отдельности. Но всё-таки вопрос про вызовы. Какие вызовы стоят перед компаниями, внедряющими подобные технологии. Наверняка же есть и нюансы, и минусы, которые возникают при внедрении таких историй.
— Мне кажется, главный вызов для любой компании, которая внедряет технологию, это как получить из неё практическую пользу, как получить результат. И здесь главное, о чём надо помнить, что с первых же шагов ты закладывать должен некую целевую систему, которую ты строишь. Ты не должен ставить свою задачу – я хочу внедрить нейросеть. Вот так, скорее всего, ничего не получится. Ты должен понять, где, в каком клиентском пути, в каком сценарии, для какого продукта ты хочешь добиться качественно нового результата и проанализировать вместе с партнёром: "Как это сделать?", "Насколько современный уровень развития технологий позволяет это сделать?" Дальше на этапе внедрения очень быстро станет понятно, что кроме выбора самой фундаментальной модели, тебе нужно будет позаботиться о нескольких вещах.
Во-первых, так как это долгосрочное бизнес-сотрудничество, надо выбирать такого партнёра, кто готов в этом пути оказывать тебе поддержку, быть с тобой. Когда тебе предоставляют что-то на условиях «as-is» («как есть» – прим. ред.) – нравится-не нравится, это очень хорошо для эксперимента, это классно, это быстро, бесплатно в конце концов. Но когда у тебя возникнут вопросы в твоих продакшн-кейсах, кому ты их будешь адресовать? – ну можешь поговорить сам с собой. Или если тебе понадобятся какие-то этапы развития модели, например, обновление её знаний или углубление её знаний в твоей предметной области – ты останешься один на один с этой задачей. Я вас уверяю, не все задачи такого рода можно решить, если ты не обладаешь полным циклом разработки фундаментальных моделей.
Следующая история, о которой ты должен позаботиться, это то, что с максимальной долей вероятности ты будешь строить агентную систему. Она будет интегрирована с какими-то твоими системами в ландшафте, с какими-то твоими данными. И здесь нужно подумать о двух вещах. Первое – это гибкость, с помощью которой ты сможешь настраивать, если надо, дообучать базовую модель. Второе – это платформа для разработки агентов, которая надолго с тобой останется. И третье – это о том, а как же интегрировать её в корпоративный ландшафт так, чтобы это было надёжно и так, чтобы заложенный сегодня фундамент рос, и на каком-то этапе ты не пришёл бы к тому, что что-то не то, мне надо все переделать, или появилась какая-то какая-то следующая модель новых классных характеристик, но принести её потом в твою интегрированную систему невозможно, потому что надо, опять же, все сценарии переделать, все перетестировать. Мы очень сильно на этом сфокусированы, потому что это вызов для нас в Сбере, это то, что мы видим как запрос от наших клиентов.
Мы сделали такой White paper, которым мы делимся сейчас со всеми, потому что это такой свод наших на сегодняшний день знаний и практик, и тех ответов, которые мы нашли, к тому, как подойти к внедрению решений, чтобы получить результат. Мы будем этот документ, безусловно, обновлять и развивать по мере того, как сами будем опробовать решения – мы всегда предлагаем и рекомендуем только то, чем пользуемся сами, для нас это принципиально важно.
Ну и ещё один, наверное, сложный такой момент, что любой путь к внедрению генеративного ИИ начинается с измерения. Если ты не знаешь, как измерить результат, ты, скорее всего, ничего не внедришь. Ты получишь какое-то количество интересных кейсов, но ты не построишь систему, которая позволит тебе принять решение – можно ли передать, например, клиентское обслуживание вот такого рода системой платформы. У тебя просто не будет системы метрик для принятия этого решения. Или ты рискнёшь, но тогда можно столкнуться с неприятными последствиями, поэтому грамотный, математически обоснованный подход к измерениям, к метрикам здесь очень-очень важен. И это первый этап на пути к внедрению, а не последний.
— Недавно вышло обновление ChatGPT, которое позволяет делать все, что угодно с контентом и произошел некий взрывной такой рост арт-контента, генерации арт-контента. Что в этом плане предоставляет GigaChat? Что он умеет?
— Я начну с того, то что OpenAI делает, конечно, великое дело. Они всему миру эту индустрию открыли. И, конечно, как это говорят, это спорно, но это, возможно, лучшая система в мире или, ну уж точно, одна из лучших безоговорочных лидеров в этом направлении. Они, конечно, большие молодцы, и то, что они делают, нам даёт вдохновение. Правда, даёт при этом вдохновение очень мало знания, потому что, когда они что-то делают, то всё для себя. Они стали абсолютно закрытой компанией и с сообществом уже как бы никакими своими наработками не делятся, хотя, как мы видим, какого-то безоговорочного преимущества это им не дало. И на самом деле с того момента, как у них появился GPT-3.5 – больше никому ничего не рассказывают о том, как конкретно они что сделали, никому.
Но тем не менее мы видим, что весь мир туда за ними пошёл и большое количество компаний сделали крайне сильные модели и действительно в разных областях, ну... как минимум наступают им на пятки. С другой стороны, что мы также видим? Мы видим, что стран, в которых существует полный цикл разработки, в каждой из них по несколько компаний этим занимаются… но стран таких осталось практически две – Сильная Америка, сильный Китай, безусловно, в Европе чуть-чуть – там есть Mistral. И далее почти ничего как бы серьезного в высшей лиге мировых моделей, в топ-10, нет. А на наш взгляд это очень важно. Места в этом там топ-10 могут постоянно меняться. Кто-то сделал чуть лучше, кто-то сделал чуть хуже.
Мы делаем ставку на следующее: что за счёт того, что мы все-таки владеем полным циклом разработки моделей, мы можем её настроить так, под твой конкретный конкретный кейс, чего ChatGPT делать не будет просто. Так, мы можем сделать, что под твой конкретный кейс, она будет решать задачи лучше всех в мире. Вот это очень важно, потому что если ты идешь за практическими кейсами внедрения, нужно это учитывать. Вторая точка различия – это то, что ChatGPT с точки зрения бизнеса. Ты можешь общаться только через API-интеграцию, и они заняли свою принципиальную позицию. В принципе, они не готовы российским компаниям это давать. Можно идти на всяческие ухищрения, но вряд ли ты построишь устойчивый бизнес, особенно крупной компанией, на таких хитрых костылях и обходных манёврах. Вряд ли это будет твое фундаментальное будущее.
С точки зрения креативности, мы на этой конференции представили следующее поколение наших моделей, которые специализируются на генерации изображения. Это семейство Kandinsky, Kandinsky 4.1 Video – она с сегодняшнего дня доступна участникам конференции, блогерам, потому что мы хотим сейчас провести этап тестирования. Как ты понимаешь, эти модели, они очень ресурсоёмкие, генерация изображений, это очень сложная вычислительная задача. Теперь мы начинаем подходить к тому горизонту, когда можно смотреть на те кейсы, когда оно может быть доступно разным пользователям, и это не станет чем-то, что запретительно дорого. Мы принципиально вкладывались в возможности модели работать более качественно с физикой объектов, потому что для нас это важно не только в смысле изобразительного искусства, для нас это важно как элемент будущего развития понимания мира в модели, создания таких «world models». Но, конечно, с точки зрения видеоизображений в мире сейчас доминируют те компании, которые обладают большим изначально накопленным видеобанком. Всем остальным, конечно, сложнее, потому что все остальные этот видеобанк собирают.
Но Kadinsky 4.1 Video – это очень сильный шаг вперёд. Это и text-to-image, и text-to-video и image-to-video модели, которые сейчас тоже вошли в мировую десятку по нашим замерам, это означает, что у них есть большая область практического применения. Кстати, B2B интерес к ним очень большой, потому что с их помощью можно создавать динамичные изображения собственных продуктов, товаров и новые клиентские сценарии, для которых раньше нужно было нанять профессиональную съёмочную команду.
— Относительно фразы про нанять профессионалов. Следующий вопрос, вернёмся, так сказать, с Запада обратно в Россию. Перестанем сравнивать ChatGPT и GigaChat.
Вопрос про найм специалистов. Как ты считаешь, стоит ли сейчас компаниям увеличивать инвестиции именно в разработчиков и нанимать профессиональных разработчиков уровня middle, senior, либо все-таки сконцентрироваться на внедрении генеративного искусственного интеллекта.
— Я считаю, что действительно наступает определенный перелом, и любой компании сейчас, прежде чем нанять еще одного разработчика, надо подумать, а может быть можно решить эти же задачи или новые задачи, которые перед вами стоят, за счёт того, что ваши команды начнут больше пользоваться современными AI-технологиями. Мы на этой конференции представили пока первый релиз, бета-версию нашего нового продукта, называется GigaStudio.
Вот в GigaStudio можно по текстовому промпту создать приложение, не будучи ещё разработчиком. Конечно, это сейчас не тот уровень, который можно использовать для крупной корпоративной системы. Но, например, для того, чтобы сделать какой-то скетч живой, попробовать какие-то варианты клиентского опыта и, в принципе, сделать такой как бы qick-start в то, что мы разрабатываем, это уже очень интересный подход, очень интересные технологии.
Я думаю что, с одной стороны, я не верю в trade-off, что искусственный интеллект заменит разработчиков – он не заменит разработчиков. Но безусловно разработчики, оснащённые искусственным интеллектом, вот они будут вытеснять тех кто им не пользуется. Я правда не думаю что такие дураки останутся, потому что если ты сегодня не используешь современные средства разработки то значит какую-то часть твоего времени, скорее всего, ты тратишь зря — «зачем тебе это делать?». Другое дело что, мне кажется, сейчас есть эпоха высококвалифицированных High-Load разработчиков. И здесь соотношение такое, что чем более простые задачи... знаете иногда есть такое презрительное название – «кодер», как бы, не разработчик. Вот им грядут тяжелые времена. Потому что нужны и всегда будут нужны разработчики, которые способны, готовы и умеют глубоко разбираться в системах, делать реальный High-Load, где нужно очень много усилий вложить в тюнинг и усовершенствование систем, которые не забыли, что такое математика, и которые способны работать с системами нового поколения, которые сейчас будут активно внедряться. Вот для них, мне кажется, золотые времена.
Вообще, тут недавно был Билл Гейтс, в одном из выступлений он сказал так – «я считаю есть три профессии, которые могут не беспокоиться за своё будущее в ближайшее время». Это как раз разработчики, AI-инженеры и специалисты по генетике, биоинформатике, вот такого рода технологиям, учёные. Всем остальным надо серьезно подумать о том, как все-таки воспользоваться этой волной, а не ждать, пока она вас накроет сверху.
— Жалко, что журналистов он не назвал в числе тех, кто не должен беспокоиться о своём будущем.
— Я считаю, что вы же продвинутые журналисты, у вас есть шанс быть на волне.
— Давай представим: вот перед тобой сейчас я, джуниор-разработчик. Я хочу строить карьеру именно в этом направлении. Как мне, как человеку, который только начинает, не подвергнуть себя соблазну использовать во всех своих процессах искусственный интеллект, а начать развиваться и углубляться в математические процессы?
— Ну, мне кажется, что здесь самое главное – это не совершить такую фундаментальную ошибку с самого начала. Вот мы говорим «джуниор», вот он кто? У нас в последнее время начала формироваться такая тенденция, и она активно промутировалась, что в России нужны какие-то сотни тысяч разработчиков, и поэтому для того, чтобы стать разработчиком, вообще не нужно высшее образование, достаточно какого-то среднего специального образования. То, что раньше ПТУ называли, колледж, всё, ты разработчик.
На самом деле, как бы, если у тебя только этот трек, то, скорее всего, у тебя проблемы. Потому что у тебя как раз фундаментального образования, которое тебе бы объяснило, как это вообще работает, тебе не дали. Тебе научили, как пользоваться этим инструментом, но когда ты знаешь только, как пользоваться, оказаться в системе, которая сейчас быстро меняется, эволюционирует, ну, тебе будет очень сложно. Кто, мне кажется, был, есть и, опять же, будет в выигрыше? Это опять же те молодые ребята, которые не стесняются со школьной скамьи инвестировать свои фундаментальные знания.
Те ребята, которые заканчивают физмат-школы, которые идут в профильные высшие учебные заведения, у которых есть курсы высшей математики, которые занимаются глубоким, сложным программированием, которые не забывают... вот сколько лет, а всё равно сложные вещи чаще всего это C++, и Go теперь, с точки зрения High-Load, не что-то там другое. Вот эти ребята, они в преимуществе, потому что он может оказаться джуниором с точки зрения своего опыта, но с точки зрения своей базы он готов – у него есть тот фундамент, на котором расти. И тогда ему ничего не страшно. Он как раз воспользуется новыми технологиями генеративки, которые помогут ему какие-то мелкие вещи добавлять, ну, там, с точки зрения его прикладных навыков. Подскажут, расскажут, как бы, помогут ему быстрее войти в проект, потому что они обладают полной полнотекстовым контекстным поиском по всему проекту. Вот здесь они ему помогут, это то, где ему как раз сложно, то, где он – джуниор, но зато у него есть фундамент. Он будет понимать, что происходит, как это эволюционирует, как эту технологию поставить себе на службу.
Я вообще считаю, что если ты хочешь чем-то заниматься, постарайся разобраться, как это работает, ну... постарайся. Никто из нас, и я в том числе, мы не знаем всего, у нас в команде все ребята, которые занимаются созданием технологий, в предметной области они значительно сильнее, чем я. Но прикладывай к этому усилия, и тогда у тебя всё будет.
Я думаю, что совет тем ребятам, которые джуниоры, создавайте себе фундамент, пока можете. Дело в том, что биологически доказано, что человеку определенный тип знаний, особенно таких фундаментально сложных, как, например, высшая математика, хорошо дается лет до 25-30. Ну, физиология у нас такая. Это так, да? Потратьте это время жизни, которое у вас есть, на вот это. Вы потом остальное доберёте. Потом, я вас уверяю, другие вещи, они несложно осваиваются.