
PARI
Data Engineer
Не указана
- Python
- SQL
- Machine Learning
- ETL
- Базы данных
- Airflow
- Git
- Docker
- ML
- DWH
- Big Data
- API
- Kafka
- Greenplum
Чем предстоит заниматься?
- Вывод в прод продуктовых решений Data команды
- Проектирование, внедрение и постоянное расширение пайплайнов данных, выполнение предварительной обработки, очистки и проверки
- Определение возможности для автоматизации и улучшения существующих процессов обработки данных, приносящих эффект бизнесу
- Разработка конвейеров данных ETL / ELT, которые легко поддерживать и контролировать
- Эффективная работа с несколькими командами для предоставления данных внутрь подразделений.
Что для нас важно?
- Опыт работы с данными от 1 года
- Свободное владение Python как основным языком + связка Airflow, Git и Docker
- Опыт работы с Kafka
- Опыт работы с базами данных: Clickhouse/Greenplum
- Навык написания сложных SQL запросов для обработки сырых данных, преобразования и их проверки
- Опыт работы с API для сбора или приема данных в пакетном или реальном времени.
Будет плюсом:
- Опыт работы с Flink
- Опыт работы с облачными решениями
- Опыт вывода Data Science моделей в прод.