Звук

Team Lead MLOps

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет
  • MLOps
  • ClearML
  • Apache Airflow
  • Triton

О роли

Мы ищем Team Lead MLOps Engineer, который возглавит развитие MLOps-направления, обеспечит стабильную работу ML-инфраструктуры и создаст эффективные процессы разработки, тестирования и развертывания моделей. Если ты готов управлять командой, внедрять передовые практики и строить масштабируемые решения, мы будем рады видеть тебя в нашей команде.

Ты будешь отвечать за платформу для разработки и внедрения моделей машинного обучения, которая уже сегодня поддерживает все наши текущие ML-решения. От того, насколько быстро и эффективно она будет развиваться, зависит успех всей ML-команды Звука. Твоя работа станет ключевым звеном в создании продуктов, которые меняют представление о музыке.

Почему это важно

Наша цель — создавать надежные и инновационные ML-решения, которые помогают бизнесу достигать новых высот. Мы стремимся к тому, чтобы наши модели работали быстро, стабильно и эффективно, а команды могли сосредоточиться на создании лучших продуктов.

Чем будешь заниматься у нас:

  • Руководить командой MLOps: управлять, наставлять и развивать инженеров.
  • Создавать и внедрять MLOps-практики: стенды, DevOps-процессы, среды разработки, тестирования, инференса и мониторинга моделей (Batch, Streaming, CPU/GPU).
  • Развивать LLMOps-практики: оптимизировать инференс LLM для ChatGPT-like решений.
  • Внедрять и поддерживать инструменты версионирования артефактов (ClearML, MLFlow, DVC и др.).
  • Помогать команде Data Scientists в выводе моделей в прод.
  • Развивать CI/CD и DAG-пайплайны для разработки, тестирования и инференса моделей.

Технологии, с которыми будешь работать: k8s, Flux2, Airflow, Redis, Qdrant, ClearML, FastAPI, MongoDB, Spark, Kafka, Prometheus, Grafana.

Успех в этой роли обеспечат:

  • Опыт работы в качестве DevOps/MLOps/ML Engineer не менее 4 лет.
  • Опыт управления командой: планирование задач, код-ревью, развитие сотрудников.
  • Глубокие знания k8s: умение разрабатывать и поддерживать сервисы в этой среде.
  • Опыт работы с MLOps-инструментами (ClearML, DVC, MLflow и др.).
  • Навыки отладки Spark-job'ов и понимание ML-алгоритмов (бустинги, сетки, LLM, распределенные вычисления).
  • Знание принципов организации распределенных информационных систем и баз данных.

Будет плюсом:

  • Опыт работы с векторными базами данных (Qdrant, Milvus или аналогами).
  • Знания в области Feature Store и обеспечения потоков данных.
  • Опыт оптимизации GPU-инференса для LLM.
  • Навыки разработки REST-сервисов.