ГК Орбита

Инженер Feature Store (Senior Data Engineer)

Не указана
  • Москва
  • От 3 до 6 лет

Группа Компаний Орбита - ведущий разработчик цифровых решений, российская аккредитованная ИТ-компания.

Мы реализуем масштабные технологические проекты с глубокой экспертизой в цифровизации бизнеса.
Ключевые отрасли: государственный сектор, FinTech, HR Tech, коммуникации и медиа, услуги, рынок недвижимости, travel.

Нам доверяют крупнейшие компании РФ, среди которых: Т1, ВТБ, Иннотех, Альфа Банк, ОИС и другие.

В рамках развития аналитической платформы Банка мы находимся в поиске Инженера Feature Store в команду Data Engineering.


Обязанности:
  • Реализация высоконагруженных конвейеров обработки данных для надежной и бесперебойной репликации данных из ИТ-систем Банка

  • Разработка комплексных решений по подготовке данных в целевых аналитических хранилищах:
    Data Lake, Sandbox, Feature Store

  • Формирование и подготовка признаков (features) для задач машинного обучения

  • Разработка и развитие ETL-проектов

  • Поддержание в актуальном состоянии технической документации по реализованному функционалу

  • Актуализация статусов задач и результатов работ в Jira

  • Проведение код-ревью, контроль качества кода инженеров и младших инженеров данных

  • Участие в развитии архитектуры Feature Store и data-платформы в целом


Требования:
  • Уверенное владение Python:

    • структуры данных и алгоритмы

    • применение принципов ООП и ФП

    • опыт написания модульных и интеграционных тестов

    • опыт работы с библиотеками анализа данных: NumPy, Pandas

  • Опыт разработки и промышленной эксплуатации сервисов загрузки и обработки
    неструктурированных и слабо структурированных данных
    (text, XML, JSON) из внешних источников

  • Способность самостоятельно разбираться с API поставщиков данных на основе документации

  • Уверенное знание SQL:

    • сложные запросы

    • оконные функции

    • профилирование и оптимизация производительности

  • Опыт работы с СУБД:
    Oracle, PostgreSQL, Greenplum

  • Опыт работы с инструментами оркестрации и мониторинга пакетных процессов: Apache Airflow

  • Опыт разработки высоконагруженных приложений обработки данных на PySpark

  • Уверенное понимание настроек Apache Spark и их влияния на производительность


Мы предлагаем:
  • Удаленную работу: можно работать полностью удаленно
  • Белую заработную плату, оформление согласно Трудовому кодексу РФ;
  • Комфортный старт: 3 месяца плавного погружения под присмотром HR;
  • Поддержку: IT-отсрочку и консультации HR/юристов;
  • Прозрачные процессы и открытую коммуникацию;
  • Работу на лучшем оборудовании без логирования времени, с фокусом на доверии и результате;
  • ДМС: медицинское страхование за счет компании;
  • Развитие: индивидуальный план обучения, посещение конференций и митапов, поддержка в развитии карьеры;
  • Личный бренд: возможность выступать на конференциях, митапах, публикация статей;
  • Бенефиты: ежеквартальное обновление корпоративных скидок;
  • Движ: организация вечеринок оффлайн и онлайн, предоставление мерча, проведение конкурсов и челленджей.

Откликайтесь - будем рады познакомиться лично! 🚀