Lamoda ищет MLOps-инженера в команду, где ML действительно работает в проде, приносит миллиарды и выходит на новый уровень с LLM и нейросетями. Строим ML-платформу полного цикла на базе Kubernetes — от экспериментов до inference-as-a-service с Triton и векторными БД, чтобы ускорить запуск AI-продуктов с месяцев до недель.
Чем предстоит заниматься:
-
Проектированием, развертыванием и сопровождением инфраструктуры хранения и поиска векторных представлений данных;
-
Выбирать, интегрировать и оптимизировать векторные базы данных (Milvus, Qdrant, pgvector и др.) с учетом алгоритмов ANN (HNSW, IVF, PQ);
-
Разрабатывать конвейеры для генерации, индексации и обновления эмбеддингов;
-
Настраивать системы мониторинга и алертинга для ML-сервисов, инфраструктурных компонентов и хранилищ;
-
Внедрять и развивать общие MLOps-инструменты: CI/CD пайплайны на базе GitLab, Model Registry, Feature Store, Data Quality, мониторинг моделей;
-
Поддерживать и развивать платформенные компоненты: кластеров, систем оркестрации, пайплайнов обработки данных, систем развёртывания;
-
Взаимодействовать с командами Data Scientist, Data Engineering и Platform-инженерами для обеспечения стабильной и масштабируемой инфраструктуры;
-
Поддерживать и оптимизировать инфраструктуры в Yandex Cloud и Bare Metal с использованием IaC-подходов.
Мы ожидаем:
-
Опыт разработки, внедрения и автоматизации ML или Data Engineering решений;
-
Понимание архитектуры и принципов работы векторных баз данных;
-
Опыт построения ML-конвейеров (Airflow, MLflow, Kubeflow и др.);
-
Понимание принципов CI/CD, разработки и эксплуатации распределённых систем;
-
Уверенный опыт работы с Kubernetes, Helm, Docker, Terraform;
-
Практический опыт работы со Spark, Airflow;
-
Уверенное владение Python и Linux;
-
Понимание основ алгоритмов машинного обучения;
-
Понимание работы LLM и RAG-паттернов.