МТС

Middle Devops Engineer [MLOps Platform, МТС Веб Сервисы]

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 1 года до 3 лет

Big Data – один из ключевых юнитов МТС. Наши технологии применяются практически во всех направлениях компании - финансы, маркетинг, обслуживание, планирование сети, HR, розница.

MLOps Platform – платформа для организации и автоматизации процессов, связанных с разработкой, обучением, тестированием и развертыванием моделей машинного обучения, а также управлением их жизненным циклом.

Сейчас мы находимся в поиске Middle Devops Engineer в MLOps Platform.

Чем предстоит заниматься:

  • Сопровождать и развивать инфраструктуру MLOps-платформы: заниматься поиском и оптимизацией узких мест, рассматривать инциденты, устранять аварии, консультировать пользователей;
  • Проводить RnD с целью внедрения нового функционала, совершенствования MLOps-платформы;
  • Разворачивать новые инструменты и сервисы MLOps-платформы;
  • Поддерживать/участвовать в реализации практик DevSecOps (внедрение практик безопасности на всех этапах разработки и применения моделей машинного обучения);
  • Проводить мониторинг использования ресурсов и планировать масштабирование инфраструктуры;
  • Участвовать в процессах миграции инфраструктуры платформы, подключении новых ресурсов в kubernetes-кластер;
  • Внедрять систему мониторинга производительности моделей и сервисов;
  • Настраивать алертинг и логирование для быстрого выявления сбоев или деградации производительности.

Что мы от тебя ждем:

  • Навыки администрирования Linux, Kubernetes, понимание и опыт работы с Docker и CI/CD инструментами, сетевое администрирование;
  • Умение автоматизировать процессы развертывания и масштабирования;
  • Анализ производительности инфраструктуры и внесение улучшений для оптимизации скорости работы платформы. Контроль за эффективным использованием ресурсов и затратами;
  • Понимание концепции observability. Знакомство с инструментами мониторинга и централизованного логирования. Навыки построения дэшбордов и настройки алертов в Grafana;
  • Умение диагностировать проблемы по логам и метрикам и принимать меры по стабилизации системы;
  • Владение инструментами экосистемы MLOps: Jupyter Notebooks, VSCode, Kserve, ArgoCD, MLFlow, Airflow;
  • Понимание предметной обрасти ML и MLOps. Понимание специфики задач и процессов Data Science;
  • Практический опыт участия во внедрении и поддержке решений для автоматизации ML-процессов (CI/CD для моделей, деплоймент, мониторинг) приветствуется;
  • Умение формулировать и доносить технические решения до коллег и пользователей платформы;
  • Опыт взаимодействия с разработчиками ML/DS-направления.

Что мы предлагаем:

  • Собственную платформу MTS Ocean для получения ИТ-ресурсов, а это значит, что деплой, мониторинг, observability — не будут для тебя проблемой, ты сможешь сосредоточиться на фичах;
  • Профессиональные гильдии инженеров, где мы поддерживаем друг друга и помогаем стать лучше;
  • Внутреннюю площадку TechTalks для обмена опытом, дискуссий, развития навыков самопрезентации;
  • Участие во внешних IT конференциях. Мы выступаем на HighLoad++, DataFest, Mobius, Test Driven Conf, Joker, DevOps, Матемаркетинг и даже проводим собственную конференцию по архитектуре True Tech Arch;
  • Полезные курсы и вебинары в корпоративном университете и электронную библиотеку;

А еще:

  • ДМС с первого месяца работы, включая стоматологию;
  • Страхование от несчастных случаев с 1 месяца работы. Материальную помощь в сложных жизненных ситуациях;
  • Отпуск 28 календарных дней;
  • Прием врачей общей практики и массаж в офисе;
  • Мобильная связь за счет компании и льготные тарифы для близких;
  • Подписка на онлайн-кинотеатр KION, сервис МТС Музыка, книжный сервис Строки от МТС, безлимитные мессенджеры и соцсети.