
Navio (ООО Автотех)
Аналитик данных
- SQL
- Анализ данных
- Аналитическое мышление
- Tableau
- DataLens
- PySpark
- pandas
- Apache Airflow
- Apache Spark
Каждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет строить MVP-алгоритмы расчета различных метрик автономных машин.
Вакансия подразумевает работу с большими объемами технических данных с использованием SQL, Spark и Polars/Pandas где объемы данных позволяют.
Примеры задач на первое время:
-
Выстраивать коммуникацию с owners (владельцами) функций автономного вождения.
-
Разрабатывать на SQL/PySpark алгоритмы расчёта метрик функций автономного вождения (например: качество удержания в полосе, качество локализации, дальность распознавания).
-
Документировать разработанные алгоритмы.
-
Проверять качество расчёта метрик после их передачи на регламентный расчёт data-инженерами.
-
Визуализировать метрики в BI-системе.
Чем предстоит заниматься:
-
Формировать выборки данных в соответствии с техническими заданиями;
-
Разрабатывать MVP (минимально жизнеспособные продукты) витрин данных;
-
Визуализировать данные для анализа и представления результатов;
-
Проектировать и документировать алгоритмы расчёта метрик для автономной технологии и других продуктов;
-
Собирать и анализировать требования к метрикам.
Что мы ждём от кандидата:
-
Хорошее знание SQL (на уровне написания сложных запросов с джойнами и оконными функциями);
-
Опыт анализа данных с использованием Python и библиотек Pandas/Polars;
-
Опыт работы хотя бы с одной из BI-систем (Metabase, Superset, Tableau, DataLens).
Будет плюсом:
-
Опыт работы со Spark;
-
Опыт работы с ClickHouse;
-
Опыт работы с Airflow/Luigi/Dagster.