12 декабря 2024

eur = 105.10 -1.20 (-1.13 %)

btc = 100 822.00$ 4 578.11 (4.76 %)

eth = 3 816.78$ 222.08 (6.18 %)

ton = 6.46$ 0.62 (10.70 %)

usd = 99.38 -0.05 (-0.05 %)

eur = 105.10 -1.20 (-1.13 %)

btc = 100 822.00$ 4 578.11 (4.76 %)

Форум

Из археологии в IT: как я не стал археологом, зато стал работать с большими данными

6 минут на чтение
Из археологии в IT: как я не стал археологом, зато стал работать с большими данными

Считается, что карьера в IT — это для технарей. Нужно иметь математический склад ума, профильное образование, умение писать код и разбираться в сложном оборудовании. Чаще всего это действительно так, но люди часто упускают из виду, что в этой сфере есть немало менеджерских профессий, в которых технические знания приветствуются, но не являются критическим требованием.

Меня зовут Александр Николаев, я — главный аналитик-исследователь в управлении моделирования розничных рисков в Газпромбанке. Свой профессиональный путь я начал с археологии, но сегодня занимаюсь совершенствованием ИИ-моделей, помогающих банку лучше управлять своим кредитным портфелем и оптимизировать внутренние процессы.

В этой статье расскажу, как и зачем я променял романтику археологии на большие данные и что нужно делать, если работаешь в гуманитарной сфере, но мечтаешь о технологиях.


В детстве я не отдавал предпочтения точным дисциплинам. У меня был аналитический склад ума, несколько раз я участвовал в олимпиадах по математике, но не занимал призовых мест. Зато любил фильмы про Индиану Джонса и экспедиции настолько, что когда пришло время выбирать профессию, я решил стать археологом и поступил на исторический факультет.

Уже со второго курса я всерьез занялся изучением древностей — в сезоны ездил в научные экспедиции: в Монголию, Казахстан и в предгорья Алтая. Зоной моих интересов была археология каменного века: мы много работали «в поле». Например, я участвовал в раскопках Чагырской пещеры на Алтае, в которой обнаружили следы присутствия неандертальцев, которые были родственниками европейских собратьев.

Пещера, которую мы изучали, находилась всего в сотне километров от знаменитой Денисовской пещеры, где обнаружили останки денисовского человека. Предполагается, что неандертальцы, которых изучали мы, и денисовцы жили примерно в одно время и могли взаимодействовать друг с другом. Вместе с командой археологов, погружаясь в культурный слой пещеры, мы пытались приоткрыть завесу тайны эволюции человека. Словом, романтично, увлекательно, но…

К концу учебы я понял, что археология — это, конечно, научные открытия, путешествия, новые интересные знакомства. Только полгода ты в экспедиции, а еще полгода — пишешь отчеты и выступаешь на конференциях. И чем дальше, тем меньше такой образ жизни совпадал с моими личными приоритетами.

И тут мне именно археология и помогла. Она, помимо прочего, предполагает еще и хороший нетворкинг, и в одной из экспедиций я познакомился с человеком, который рассказал мне о магистерской программе по социологии в Высшей школе экономики. Я решил попробовать.

Из археологов в демографы

Социология, а именно демография, которую я изучал в магистратуре, оказалась очень захватывающей дисциплиной. Демография — это вся наша жизнь, от рождения до смерти. Процессы, которые описывает демография, оказывают значительное влияние на историю человечества. Понимание этой взаимосвязи помогает немного заглянуть в будущее.

Как научно-технологический прогресс повлиял на рождаемость? Почему в каких-то регионах семь детей на женщину, а в каких-то — один? Какие регионы будут драйверами мировой экономики в конце XXI века? Разбираться во всем этом оказалось очень увлекательно, хотя и непросто, ведь демография — это социология плюс прогнозирование, а прогнозирование — это математика, которую мне пришлось «прокачать» после нескольких лет в археологии.

Во время обучения я некоторое время работал в университете — занимался анализом данных и подготовкой отчетов, а после попал на стажировку в компанию, специализирующуюся на медиааналитике. Занимался прогнозированием рейтингов телевизионных программ (и рассчитывал потенциальную стоимость рекламного эфирного времени) на основе статистических данных о телепросмотрах.

Работа с одной стороны была рутинной, а с другой — творческой, ведь для того, чтобы твои прогнозы «бились» с реальными результатами, следовало правильно оценивать потенциал нового телешоу. Университетские знания о демографии как прикладном виде социологии и умение составлять математические прогнозы тут очень пригодились.

В этой сфере я проработал около четырех лет, чтобы в конце концов понять, что я остановился в профессиональном росте. Специфика работы в медиааналитике такая, что весь необходимый технический инструментарий ты осваиваешь довольно быстро, и возможности развивать «жесткие» навыки дальше исчерпываются. Я стал заниматься самообразованием: прошел несколько курсов по SQL и Python и стал искать сферу, где можно более разнообразно работать с данными. В итоге устроился маркетинговым аналитиком в телекоммуникационную компанию.

IT, но не то

Телеком-оператор развивался в новых нишах — в частности, делал собственный онлайн-кинотеатр, и мой опыт прогнозирования для телевидения там очень пригодился. Новая работа в большей степени позволяла работать с данными.

Мы делали отчеты из баз данных, аналитику операционных показателей бизнеса: сколько пользовательской базы набрали, какой отток, какие показатели по выручке и какой прогноз, какой план, с какой скоростью набираем абонентскую базу и так далее.

Со временем меня начали больше привлекать к финансовым задачам: прогнозирование бюджета, исполнение бюджета, много цифр, гигантские таблицы и минимум взаимодействия с людьми, а я как раз видел самые сильные свои стороны в том, чтобы делать работу, подразумевающую не только аналитику, но и взаимодействие с коллегами.

Поэтому, проработав в телекоме два года, я снова стал искать возможности и нашел их в Газпромбанке.

«Нефтяник» данных

Я работаю в департаменте анализа данных и моделирования, в управлении моделирования розничных рисков. Это команда дата-сайентистов, занимающихся разработкой моделей для бизнес-процессов банка. Например, наши модели помогают банку одобрять перспективных заемщиков и отказывать неблагонадежным.

Чтобы модель хорошо работала, ее нужно обучить на качественном датасете, то есть таком наборе данных, который позволил бы модели оценивать анкеты заемщиков в нужном контексте: учитывать значимую информацию и отбрасывать незначимую. Модель в этом смысле — как автомобиль: если заправить хорошим топливом, он и ехать будет хорошо.

Я занимаюсь поиском и пилотированием качественного «топлива» — или внешних источников данных, используемых нами для обучения моделей наряду с теми данными о потенциальном заемщике, которые у банка уже есть. Чем качественней и полней данные, тем более точный прогноз сможет выдать модель.

Внешними источниками данных могут быть организации, работающие с клиентами того же профиля, какой имеют клиенты, обращающиеся в банк за кредитом. Эти данные анонимизированы и выдаются чаще всего в виде вероятностной оценки от 0 до 1. Чем выше оценка, тем потенциально более надежен заемщик. Но проблема в том, что не все данные от внешних провайдеров собраны и проанализированы так, чтобы помогать нашим моделям точнее прогнозировать.

Например, нам нужны данные с максимально обширной демографической выборкой, но некоторые источники (скажем, небольшие телеком-операторы) в состоянии предоставить сведения, ограниченные только собственной абонентской базой, полнота которой не обязательно соответствует нашим требованиям.

Моя задача заключается как раз в том, чтобы отобрать наиболее качественные данные, пропилотировать их на наших моделях и понять — подходят они нам или нет. Работа считается выполненной хорошо, если качество метрик по итогам обучения модели увеличивается.

С помощью данных модели не только предсказывают качественных заемщиков, но и помогают оптимизировать внутренние банковские процессы. Например, у нас есть собственная геоплатформа, в которой тоже используются прогнозирующие модели. Мы обучаем их на данных о людских потоках, точках притяжения, среднем чеке на конкретной локации и т. д., и в результате модели помогают выбрать наиболее удачные места для установки банкоматов и, допустим, построить самый оптимальный маршрут для машины инкассации.

Моя работа в Газпромбанке выгодно отличается от всего моего предыдущего опыта. Во-первых, тем, что она совмещает в себе не только работу с данными, но и человеческое взаимодействие: реализовывая проекты, я много общаюсь как с коллегами внутри команды, так и с внешними контрагентами. Во-вторых, характер работы таков, что я всегда вижу ее результат. Если набор данных оказался удачным, это напрямую отражается на бизнес-результатах.

Что общего у раскопок, демографии и больших данных

У археологии, социологии и аналитики данных, которой я занимаюсь сейчас, на самом деле больше общего, чем может показаться на первый взгляд. Сидишь ли ты часами в раскопе с кисточкой, аккуратно погружаясь вглубь истории, чтобы добраться до искомого артефакта, или же продираешься сквозь бесконечные таблицы с цифрами статистики в поисках твердых тенденций либо оцениваешь, поможет ли очередной дата-сет улучшить точность прогноза модели, — ты всегда занимаешься отделением «шума» от полезной информации.

Так что в определенном смысле на протяжении всего своего карьерного пути я занимался и совершенствовался в одном и том же — просто в разных формах.

Как войти в IT

«Чистые» IT-профессии действительно требуют твердых технических навыков, но банковская (да и многие другие) сфера сегодня живет как минимум в двух мирах: с одной стороны, любой современный банкинг — это продвинутый IT-продукт, с другой — это организация, имеющая дело с деньгами людей, а значит (хоть и опосредованно), — с их финансовым, социальным и другими статусами. Это сферы, которые требуют не столько технических, сколько гуманитарных компетенций — в области социологии и демографии в частности.

Разумеется, это не единственный пример такого соприкосновения технических и гуманитарных сфер, и потому у людей, мечтающих о карьере в IT, но не имеющих соответствующего образования, всегда есть шанс добиться своих целей.

Для первого шага в IT совсем не обязательно получать вторую техническую специальность, можно использовать хотя бы бесплатные возможности для самообучения (курсы, тренинги, митапы, наставничество), которые сейчас представлены в изобилии. С моей точки зрения, главное в этом деле — не бояться сменить сферу деятельности и быть готовым учиться новому. Прежний опыт, даже если он далек от IT-контекста, обязательно пригодится.


Читать истории других сотрудников:

Как я начала заниматься Data Science, потом не перестала и сделала на этом карьеру

С завода в IT: почему менять карьерный трек никогда не поздно

Из архитекторов в IT: как архитектурное образование помогает строить карьеру в IT

Pascal, экономика, крафтовое пиво и ML-модели. Как я выбрал карьеру экономиста, но в итоге оказался в IT

Путь из разработчика в менеджеры, или как я не стал инженером холодильных установок

Я ушёл из IT в фэшн-фото, вернулся обратно и вырос из мидл-разработчика в CTO

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
70c20f70-7f12-4e9d-a022-b281d879c6f2-изображение-0905b98de-7995-4bca-b9ef-227338105e4f-изображение-14deeffce-0bb5-4b63-8a59-f0f5676c5762-изображение-2

GigaChat Max: коротко о главном

Яндекс запустил Документы со встроенной YandexGPT

Полная версия 
3e71e041-6300-43ea-85c9-90df3c814a3b-изображение-0

GigaChat Max: коротко о главном

Т-банк выпустил в открытый доступ большую языковую модель T-Pro на 32 млрд параметров

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 300
Газпромбанк
МТС
Т-Банк
X5 Tech
Сбер
билайн
Яндекс Практикум
Ozon Tech
Циан
Банк 131