
Flowwow
ML Ops Engineer / Инженер по эксплуатации систем машинного обучения
- Kubernetes
- Yandex Cloud
- MLflow
- Apache Airflow
- Helm
Flowwow — это маркетплейс цветов и подарков. У нас продают более 15 тысяч селлеров в 1200+ городах России и мира. Платформа позволяет из любой точки мира заказать, оплатить и отследить доставку цветов, тортов, десертов, комнатных растений, декора, украшений, картин и других товаров.
Мы — аккредитованная IT-компания: создаем качественный и удобный сервис, который делает счастливыми тысячи людей по всему миру. С 2021 года показываем уверенный рост х2 по большинству показателей, в том числе по темпам расширения команды.
В 2024 году вошли в Топ-20 лучших работодателей, по версии HeadHunter (средние компании).
Мы ищем опытного ML Ops Engineer, который примет участие в проектировании и построение надежной инфраструктуры для наших ML-моделей. Ваша работа станет основой для эффективной разработки, обучения и развертывания ML-решений, включая высоконагруженные сервисы онлайн-рекомендаций.
Что нужно делать:
-
Проектировать и создавать комплексную ML-платформу на базе Kubernetes
-
Разрабатывать инфраструктуру для непрерывного обучения и развертывания ML-моделей
-
Создавать масштабируемые и отказоустойчивые решения для онлайн-инференса моделей
-
Настраивать мониторинг работы моделей и дрейфа данных
-
Автоматизировать пайплайны машинного обучения от сбора данных до деплоя модели
-
Интегрировать ML-платформу с существующими системами (Data Platform на базе S3/Iceberg, Trino, Spark)
-
Обеспечивать высокую доступность и низкую задержку сервисов рекомендаций
-
Внедрять системы для версионирования данных, моделей и конфигураций
-
Разрабатывать решения для A/B тестирования моделей.
Ожидания от кандидата:
-
5+ лет опыта в сфере MLOps / DevOps с фокусом на ML-инфраструктуру
-
Глубокое знание Kubernetes и контейнеризации (у нас k8s в Я-облаке)
-
Опыт построения и управления ML-платформами
-
Опыт работы с инструментами MLOps (MLflow, Airflow)
-
Уверенное владение инструментами CI/CD для ML-пайплайнов
-
Опыт работы с системами онлайн-инференса (KServe, TF Serving, TorchServe и т.д.)
-
Практические навыки в Cloud Native технологиях (Helm, Istio, Prometheus, Grafana)
-
Опыт оптимизации инфраструктуры для ML-моделей (CPU/GPU/память)
-
Понимание принципов работы рекомендательных систем и особенностей их развертывания.
Будет плюсом:
-
Опыт работы с Feature Store (Feast, Tecton или аналоги)
-
Знание GitOps методологии и инструментов (ArgoCD, FluxCD)
-
Практический опыт с HPA и CA
-
Опыт настройки NVIDIA GPU операторов в Kubernetes
-
Знание и опыт работы с облачными провайдерами (AWS, GCP, Azure, Я-облако)
-
Опыт работы с большими данными (Spark, Hadoop)
-
Знание методов оптимизации Kubernetes для высоконагруженных ML-сервисов.
Мы предлагаем:
-
работу над высоконагруженным сервисом, приносящим пользу сотням тысяч людей;
-
удаленную работу или современный комфортный офис в центре Москвы/Санкт-Петербурга;
-
льготы IT-компании для всех сотрудников;
-
компенсацию стоимости техники, которую вы приобретаете для работы;
-
компенсацию расходов на занятия спортом;
-
расширенное медицинское обслуживание;
-
возможность проходить профильное обучение и повышать квалификацию за счет компании, посещать профильные конференции и воркшопы;
-
доступ к сервису психологической поддержки;
-
корпоративную программу лояльности: персональная скидка на Flowwow + предложения от партнеров;
-
развитое внутреннее комьюнити, где можно делиться опытом и навыками в разных сферах, участвовать в играх, мероприятиях и даже в режиме home office чувствовать себя частью команды.
Наши ценности
Забота и любовь
Наш продукт основан на желании людей радовать друг друга и быть вместе. Пока любовь жива, у Flowwow будут пользователи.
Развитие и рост
Flowwow быстро развивается и с радостью поддерживает инициативы сотрудников.
Культура взаимопомощи
У нас работают люди, вовлеченные в процесс и небезразличные к тому, что они делают.
Открытость к изменениям
Каждый может проявлять инициативу, предлагать и быстро видеть свой вклад в общий успех.
Благотворительность
Одна из целей Flowwow — помогать людям. Нас объединяют социальная ответственность и готовность участвовать в специальных благотворительных мероприятиях.