СБЕР

Data Engineer (Рекомендательная система)

Не указана
  • Москва
  • Частичная занятость
  • Удаленная работа
  • От 3 до 6 лет

ИТ B2C — самая крупная экосистема в Сбере. Нас более 8000 человек в 18 городах России. Мы занимаемся разработкой и развитием розничных решений, помогая сделать сервисы Банка доступнее, безопаснее и удобнее.

Наша главная цель - построить современную, масштабируемую платформу, которая будет постоянно предвосхищать и превосходить ожидания пользователей, предоставляя им персонализированный и релевантный контент на всем клиентском пути в экосистеме Сбер.

Наша платформа будет обслуживать широкий круг потребителей и строить персональные рекомендации во всех сферах бизнеса, таких как музыка, фильмы, онлайн торговля, медицина, логистика и многих других, которые присутствуют в быстро растущей экосистеме. Если ты мечтаешь поучаствовать в создании такой рекомендательной системы, то тебе к нам!

Интеллектуальное ядро такой системы - это алгоритмы машинного обучения, которые анализируют по-настоящему большие данные, и в реальном времени рассчитывают предпочтения миллионов конечных пользователей. Работая в нашей команде, ты будешь участвовать в исследовании, разработке, тестировании и внедрении самых передовых алгоритмов классического и глубокого обучения в части рекомендаций. Ты получишь опыт внедрения таких алгоритмов в реальной индустриальной экосистеме, начиненной большими данными и работающей с высокими нагрузками при их обработке.

Задачи:

  • разработка продакшен-пайплайнов обработки данных
  • продуктизация прототипов команды Data Science
  • рerformance оптимизации кода по обработке больших массивов данных или онлайн сервисов рекомендаций с высокой нагрузкой.

Стек технологий:

  • для разработки используем: Python, PySpark, Pandas, Redis, PostgreSQL, AirFLow, MLFlow и др.
  • для организации работы: Jira, Confluence, Git

Требования:

  • мотивация учиться и развиваться в области рекомендательных систем
  • экспертное знание Python
  • уверенное знание Spark (и желательно Pandas)
  • опыт написания промышленных пайплайнов обработки данных, содержащих множество шагов, зависимостей и сложную логику
  • опыт использования Airflow (или другого industry-standard оркестраторов пайплайнов, т.к. Luigi, Dagster и т.д.)
  • хорошее понимание баз данных SQL / NoSQL

Условия:

  • офисный формат работы/гибридный(опционально)
  • годовой бонус и ежегодный пересмотр
  • расширенный ДМС с первого дня + стоматология и льготное страхование для семьи
  • корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях
  • офис на Кутузовской с зонами отдыха и спортзалом
  • 90 дней удаленной работы из любого региона (не применимо для сопровождения)
  • Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ, корпоративная пенсионная программа, подписка СберПрайм+, скидки от партнеров и сервисов группы компаний