Big Data является одним из приоритетных направлений компании. Наша основная задача сейчас — создать инструменты для более качественного изучения трендов среди наших покупателей.
Стек технологий: Python, Airflow, Spark, Hive, Jupyter, MLFlow, pyTorch, Keras, Tensorflow, PostgreSQL, Kubernetes, Git
Обязанности:
- Участвовать в разработке продуктивных систем
- Строить модели машинного обучения, улучшать качество прогноза
- Заниматься аналитикой и проверкой гипотез
- Развивать инструменты для проведения A/B тестов
- Писать код, проводить code-review
- Предлагать способы оптимизации и совершенствования существующих инструментов
Требования:
- Знание Python (Scala/Java могут оказаться плюсом)
- Знание классических алгоритмов и структур данных
- Знание теоретических и практических продвинутых методов машинного обучения
- Знание SQL, знакомство с hadoop-стэком (кандидаты уровня middle должны понимать, как выглядит план запросов и что происходит "под капотом")
- A/B тесты, генерация и проверка гипотез (будет плюсом опыт с variance reduction, CUPED, линеаризацией и методом бакетов)
- Опыт работы с Docker, Kubernetes, Pyspark, Kafka, Postgres, Airflow
- Наличие опыта вывода разработанных решений в прод
Контакт для связи: @DANAlina95 (Алина)
Читать первым в Telegram-канале «Код Дурова»