Из археологии в IT: как я не стал археологом, зато стал работать с большими данными
Считается, что карьера в IT — это для технарей. Нужно иметь математический склад ума, профильное образование, умение писать код и разбираться в сложном оборудовании. Чаще всего это действительно так, но люди часто упускают из виду, что в этой сфере есть немало менеджерских профессий, в которых технические знания приветствуются, но не являются критическим требованием.
Меня зовут Александр Николаев, я — главный аналитик-исследователь в управлении моделирования розничных рисков в Газпромбанке. Свой профессиональный путь я начал с археологии, но сегодня занимаюсь совершенствованием ИИ-моделей, помогающих банку лучше управлять своим кредитным портфелем и оптимизировать внутренние процессы.
В этой статье расскажу, как и зачем я променял романтику археологии на большие данные и что нужно делать, если работаешь в гуманитарной сфере, но мечтаешь о технологиях.
В детстве я не отдавал предпочтения точным дисциплинам. У меня был аналитический склад ума, несколько раз я участвовал в олимпиадах по математике, но не занимал призовых мест. Зато любил фильмы про Индиану Джонса и экспедиции настолько, что когда пришло время выбирать профессию, я решил стать археологом и поступил на исторический факультет.
Уже со второго курса я всерьез занялся изучением древностей — в сезоны ездил в научные экспедиции: в Монголию, Казахстан и в предгорья Алтая. Зоной моих интересов была археология каменного века: мы много работали «в поле». Например, я участвовал в раскопках Чагырской пещеры на Алтае, в которой обнаружили следы присутствия неандертальцев, которые были родственниками европейских собратьев.
Пещера, которую мы изучали, находилась всего в сотне километров от знаменитой Денисовской пещеры, где обнаружили останки денисовского человека. Предполагается, что неандертальцы, которых изучали мы, и денисовцы жили примерно в одно время и могли взаимодействовать друг с другом. Вместе с командой археологов, погружаясь в культурный слой пещеры, мы пытались приоткрыть завесу тайны эволюции человека. Словом, романтично, увлекательно, но…
К концу учебы я понял, что археология — это, конечно, научные открытия, путешествия, новые интересные знакомства. Только полгода ты в экспедиции, а еще полгода — пишешь отчеты и выступаешь на конференциях. И чем дальше, тем меньше такой образ жизни совпадал с моими личными приоритетами.
И тут мне именно археология и помогла. Она, помимо прочего, предполагает еще и хороший нетворкинг, и в одной из экспедиций я познакомился с человеком, который рассказал мне о магистерской программе по социологии в Высшей школе экономики. Я решил попробовать.
Из археологов в демографы
Социология, а именно демография, которую я изучал в магистратуре, оказалась очень захватывающей дисциплиной. Демография — это вся наша жизнь, от рождения до смерти. Процессы, которые описывает демография, оказывают значительное влияние на историю человечества. Понимание этой взаимосвязи помогает немного заглянуть в будущее.
Как научно-технологический прогресс повлиял на рождаемость? Почему в каких-то регионах семь детей на женщину, а в каких-то — один? Какие регионы будут драйверами мировой экономики в конце XXI века? Разбираться во всем этом оказалось очень увлекательно, хотя и непросто, ведь демография — это социология плюс прогнозирование, а прогнозирование — это математика, которую мне пришлось «прокачать» после нескольких лет в археологии.
Во время обучения я некоторое время работал в университете — занимался анализом данных и подготовкой отчетов, а после попал на стажировку в компанию, специализирующуюся на медиааналитике. Занимался прогнозированием рейтингов телевизионных программ (и рассчитывал потенциальную стоимость рекламного эфирного времени) на основе статистических данных о телепросмотрах.
Работа с одной стороны была рутинной, а с другой — творческой, ведь для того, чтобы твои прогнозы «бились» с реальными результатами, следовало правильно оценивать потенциал нового телешоу. Университетские знания о демографии как прикладном виде социологии и умение составлять математические прогнозы тут очень пригодились.
В этой сфере я проработал около четырех лет, чтобы в конце концов понять, что я остановился в профессиональном росте. Специфика работы в медиааналитике такая, что весь необходимый технический инструментарий ты осваиваешь довольно быстро, и возможности развивать «жесткие» навыки дальше исчерпываются. Я стал заниматься самообразованием: прошел несколько курсов по SQL и Python и стал искать сферу, где можно более разнообразно работать с данными. В итоге устроился маркетинговым аналитиком в телекоммуникационную компанию.
IT, но не то
Телеком-оператор развивался в новых нишах — в частности, делал собственный онлайн-кинотеатр, и мой опыт прогнозирования для телевидения там очень пригодился. Новая работа в большей степени позволяла работать с данными.
Мы делали отчеты из баз данных, аналитику операционных показателей бизнеса: сколько пользовательской базы набрали, какой отток, какие показатели по выручке и какой прогноз, какой план, с какой скоростью набираем абонентскую базу и так далее.
Со временем меня начали больше привлекать к финансовым задачам: прогнозирование бюджета, исполнение бюджета, много цифр, гигантские таблицы и минимум взаимодействия с людьми, а я как раз видел самые сильные свои стороны в том, чтобы делать работу, подразумевающую не только аналитику, но и взаимодействие с коллегами.
Поэтому, проработав в телекоме два года, я снова стал искать возможности и нашел их в Газпромбанке.
«Нефтяник» данных
Я работаю в департаменте анализа данных и моделирования, в управлении моделирования розничных рисков. Это команда дата-сайентистов, занимающихся разработкой моделей для бизнес-процессов банка. Например, наши модели помогают банку одобрять перспективных заемщиков и отказывать неблагонадежным.
Чтобы модель хорошо работала, ее нужно обучить на качественном датасете, то есть таком наборе данных, который позволил бы модели оценивать анкеты заемщиков в нужном контексте: учитывать значимую информацию и отбрасывать незначимую. Модель в этом смысле — как автомобиль: если заправить хорошим топливом, он и ехать будет хорошо.
Я занимаюсь поиском и пилотированием качественного «топлива» — или внешних источников данных, используемых нами для обучения моделей наряду с теми данными о потенциальном заемщике, которые у банка уже есть. Чем качественней и полней данные, тем более точный прогноз сможет выдать модель.
Внешними источниками данных могут быть организации, работающие с клиентами того же профиля, какой имеют клиенты, обращающиеся в банк за кредитом. Эти данные анонимизированы и выдаются чаще всего в виде вероятностной оценки от 0 до 1. Чем выше оценка, тем потенциально более надежен заемщик. Но проблема в том, что не все данные от внешних провайдеров собраны и проанализированы так, чтобы помогать нашим моделям точнее прогнозировать.
Например, нам нужны данные с максимально обширной демографической выборкой, но некоторые источники (скажем, небольшие телеком-операторы) в состоянии предоставить сведения, ограниченные только собственной абонентской базой, полнота которой не обязательно соответствует нашим требованиям.
Моя задача заключается как раз в том, чтобы отобрать наиболее качественные данные, пропилотировать их на наших моделях и понять — подходят они нам или нет. Работа считается выполненной хорошо, если качество метрик по итогам обучения модели увеличивается.
С помощью данных модели не только предсказывают качественных заемщиков, но и помогают оптимизировать внутренние банковские процессы. Например, у нас есть собственная геоплатформа, в которой тоже используются прогнозирующие модели. Мы обучаем их на данных о людских потоках, точках притяжения, среднем чеке на конкретной локации и т. д., и в результате модели помогают выбрать наиболее удачные места для установки банкоматов и, допустим, построить самый оптимальный маршрут для машины инкассации.
Моя работа в Газпромбанке выгодно отличается от всего моего предыдущего опыта. Во-первых, тем, что она совмещает в себе не только работу с данными, но и человеческое взаимодействие: реализовывая проекты, я много общаюсь как с коллегами внутри команды, так и с внешними контрагентами. Во-вторых, характер работы таков, что я всегда вижу ее результат. Если набор данных оказался удачным, это напрямую отражается на бизнес-результатах.
Что общего у раскопок, демографии и больших данных
У археологии, социологии и аналитики данных, которой я занимаюсь сейчас, на самом деле больше общего, чем может показаться на первый взгляд. Сидишь ли ты часами в раскопе с кисточкой, аккуратно погружаясь вглубь истории, чтобы добраться до искомого артефакта, или же продираешься сквозь бесконечные таблицы с цифрами статистики в поисках твердых тенденций либо оцениваешь, поможет ли очередной дата-сет улучшить точность прогноза модели, — ты всегда занимаешься отделением «шума» от полезной информации.
Так что в определенном смысле на протяжении всего своего карьерного пути я занимался и совершенствовался в одном и том же — просто в разных формах.
Как войти в IT
«Чистые» IT-профессии действительно требуют твердых технических навыков, но банковская (да и многие другие) сфера сегодня живет как минимум в двух мирах: с одной стороны, любой современный банкинг — это продвинутый IT-продукт, с другой — это организация, имеющая дело с деньгами людей, а значит (хоть и опосредованно), — с их финансовым, социальным и другими статусами. Это сферы, которые требуют не столько технических, сколько гуманитарных компетенций — в области социологии и демографии в частности.
Разумеется, это не единственный пример такого соприкосновения технических и гуманитарных сфер, и потому у людей, мечтающих о карьере в IT, но не имеющих соответствующего образования, всегда есть шанс добиться своих целей.
Для первого шага в IT совсем не обязательно получать вторую техническую специальность, можно использовать хотя бы бесплатные возможности для самообучения (курсы, тренинги, митапы, наставничество), которые сейчас представлены в изобилии. С моей точки зрения, главное в этом деле — не бояться сменить сферу деятельности и быть готовым учиться новому. Прежний опыт, даже если он далек от IT-контекста, обязательно пригодится.
Читать истории других сотрудников:
— Как я начала заниматься Data Science, потом не перестала и сделала на этом карьеру
— С завода в IT: почему менять карьерный трек никогда не поздно
— Из архитекторов в IT: как архитектурное образование помогает строить карьеру в IT
— Pascal, экономика, крафтовое пиво и ML-модели. Как я выбрал карьеру экономиста, но в итоге оказался в IT
— Путь из разработчика в менеджеры, или как я не стал инженером холодильных установок
— Я ушёл из IT в фэшн-фото, вернулся обратно и вырос из мидл-разработчика в CTO
Читать первым в Telegram-канале «Код Дурова»