Navio (ООО Автотех)

Аналитик данных

Не указана
  • Москва
  • Полная занятость
  • Полный день
  • От 3 до 6 лет
  • SQL
  • Анализ данных
  • Аналитическое мышление
  • Tableau
  • DataLens
  • PySpark
  • pandas
  • Apache Airflow
  • Apache Spark

Каждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет строить MVP-алгоритмы расчета различных метрик автономных машин.

Вакансия подразумевает работу с большими объемами технических данных с использованием SQL, Spark и Polars/Pandas где объемы данных позволяют.

Примеры задач на первое время:

  • Выстраивать коммуникацию с owners (владельцами) функций автономного вождения.

  • Разрабатывать на SQL/PySpark алгоритмы расчёта метрик функций автономного вождения (например: качество удержания в полосе, качество локализации, дальность распознавания).

  • Документировать разработанные алгоритмы.

  • Проверять качество расчёта метрик после их передачи на регламентный расчёт data-инженерами.

  • Визуализировать метрики в BI-системе.

Чем предстоит заниматься:

  • Формировать выборки данных в соответствии с техническими заданиями;

  • Разрабатывать MVP (минимально жизнеспособные продукты) витрин данных;

  • Визуализировать данные для анализа и представления результатов;

  • Проектировать и документировать алгоритмы расчёта метрик для автономной технологии и других продуктов;

  • Собирать и анализировать требования к метрикам.

Что мы ждём от кандидата:

  • Хорошее знание SQL (на уровне написания сложных запросов с джойнами и оконными функциями);

  • Опыт анализа данных с использованием Python и библиотек Pandas/Polars;

  • Опыт работы хотя бы с одной из BI-систем (Metabase, Superset, Tableau, DataLens).

Будет плюсом:

  • Опыт работы со Spark;

  • Опыт работы с ClickHouse;

  • Опыт работы с Airflow/Luigi/Dagster.