Red Petroleum

Data Scientist

Не указана
  • Бишкек
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет

Альфа Ойл развивает внутреннюю Data Science-команду. Уже выстроена инфраструктура данных — DWH, витрины и BI-отчётность. Команда небольшая, с высокой автономностью.

Фокус проекта: маркетинг и клиентская аналитика: сегментация, персонализация, рекомендательные модели. Далее — расширение на другие направления бизнеса.

Задачи:

  • Переводить бизнес-цели в ML-задачи, определять метрики успеха;
  • Проводить EDA, статистический анализ и проверку гипотез;
  • Разрабатывать фичи и обучать модели на данных из DWH;
  • Создавать и тестировать модели сегментации клиентов и рекомендательные алгоритмы (ALS/BPR, бустинг, похожесть, ранжирование).
  • Обеспечивать интерпретируемость решений (FE, SHAP/LIME и т.д.) и подготовку выводов для бизнеса;
  • Совместно с DE и BI интегрировать результаты (сегменты, скоринги) в витрины данных, Power BI или иные системы;
  • Оценивать эффекты кампаний (uplift, ROI), участвовать в A/B-тестах;Документировать подходы и обеспечивать воспроизводимость решений.

Требования:

  • Уверенный Python: pandas/polars, numpy, scikit-learn, xgboost/catboost и другие типовые библиотеки DS;
  • Классический ML: регрессия, бустинг, кластеризация, ранжирование;
  • SQL на уровне уверенной работы с витринами и аналитическими запросами;
  • Понимание метрик качества и бизнес-эффекта (uplift, ROI);
  • Опыт работы с транзакционными/клиентскими данными (ритейл, e-commerce, лояльность);
  • Умение донести результаты и предложить бизнес-интерпретацию.

Будет плюсом

  • Опыт деплоя моделей: batch-скоринг, сохранение в витрины, трекинг экспериментов (MLflow или аналоги);
  • Навык настройки простых оркестраций (Airflow или аналоги);
  • Опыт A/B-тестов, CUPED/стратификация;
  • Знание PyTorch/TensorFlow, NLP/LLM — как направление развития (у компании есть текущие проекты);
  • Опыт работы с ClickHouse/Postgres.

Почему стоит

  • Проекты с прямым влиянием на выручку и удержание клиентов;
  • Большие реальные данные (>500 млн строк), готовая инфраструктура;
  • Свобода выбора инструментов и подходов;
  • Участие в формировании Data Science-практики компании.