Ventra

Data Engineer

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 1 года до 3 лет
  • Python
  • SQL
  • Apache Airflow
  • Hadoop
  • PySpark
  • Apache Hive
  • PostgreSQL
  • Clickhouse

Задачи:

  • Проектировать и собирать витрины данных по разработанному ТЗ;
  • Проектировать, разрабатывать и поддерживать ETL-процессы для загрузки данных из/в Data Lake;
  • Писать документацию;
  • Проводить кросс-ревью кода;
  • Работать с data-аналитиками для создания новых и оптимизации существующих витрин.

Требования:

  • Опыт на позиции Data Engineer от 1,5 лет;
  • Опыт оптимизации производительности запросов (партиционирование, индексы, кеширование);
  • Понимание основных операций СУБД и принципов DWH;
  • Опыт работы с Hadoop технологиями (Spark, Hive и тд);
  • Опыт работы с Azure/Yandex облачными платформами;
  • Опыт разработки и поддержки DAGs в Apache Airflow;
  • Уверенное владение SQL, Python, pySpark.

Будет плюсом:

  • Опыт работы с базами данных PostgreSQL и ClickHouse;
  • Опыт работы с Trino;
  • Опыт работы с инструментами обеспечения качества данных (Great Expectations).

Условия:

  • Трудоустройство по ТК РФ в IT-аккредитованную компанию;
  • График работы с 9 до 18 по Москве;
  • Удаленный формат работы или офис в Москве;
  • ДМС.