
МТТ (MTC Exolve)
Lead DevOps-инженер/Head of DevOps
Не указана
- CI/CD
- Kubernetes, Helm, Docker
- Prometheus, Grafana, Loki, OpenTelemetry
- Python, Bash
- Gitlab, GitlabCI, Hashicorp Vault
В связи с расширением продуктов и команд мы ищем DevOps инженера
Задачи:
- разработка и валидация схем интеграции IT-систем МТТ и внешними решениями
- проработка и согласование технических мероприятий по повышению качества связи
- сокращение сроков разработки функционала за счет минимизации ошибок в разрабатываемых технических решения, а также сокращения сроков проработки технических решений
- отладка процесса трабл-шутинга и мониторинга
НАШИ ТЕХНОЛОГИИ / ИНСТРУМЕНТЫ:
- Kubernetes, Helm, Docker, Containerd, Kaniko, Cillium
- Prometheus, VictoriaMetrics, Grafana, Loki, Jaeger
- Ansible
- Python, Bash
- S3 (minio)
- Gitlab, GitlabCI
- Jira, Confluence
- Nginx, Haproxy, Envoy
- Nginx-Ingress, Linkerd
- Harbor
- Docker, Docker-Compose
СТЕК НАШИХ РАЗРАБОТЧИКОВ: Golang, PHP, VueJS, PostgreSQL, MongoDB, ClickHouse, RabbitMQ, Redis
Что мы ожидаем от кандидата:
1. Общие требования
- опыт работы в DevOps/SRE/Platform Engineering не менее 5 лет, из них 2+ года на руководящей должности (Team Lead, Lead DevOps, Head of DevOps)
- глубокие знания принципов DevOps, CI/CD, Infrastructure as Code (IaC), SRE
- умение выстраивать процессы и организовывать работу команды
- опыт подбора, адаптации (onboarding) и развития инженеров
2. Технические навыки
Обязательные:
- оркестрация и контейнеризация (Kubernetes, Docker)
- навыки настройки отказоустойчивости и HA-решений (HAProxy, Keepalived)
- инфраструктура как код (Terraform, Ansible)
- CI/CD-системы (GitLab CI/CD, ArgoCD)
- мониторинг и логирование (Prometheus, Grafana, ELK, OpenTelemetry)
- безопасность (DevSecOps, IAM, Secrets Management, Compliance)
- управление производительностью и надежностью (SLO/SLI, Error Budgets)
Базы данных:
- администрирование и оптимизация (PostgreSQL, MySQL/MariaDB, Redis, MongoDB, ClickHouse)
- репликация, шардинг, кластеризация (Patroni, Galera, Redis Cluster)
- резервное копирование и восстановление (PgBackRest, WAL-G, mysqldump)
Брокеры сообщений и стриминг:
- RabbitMQ: кластеризация, мониторинг (Prometheus), HA-настройки, TLS
- Apache Kafka: управление кластерами (Kraft/ZooKeeper), тюнинг производительности, мониторинг (Kafka Manager, ksqlDB), безопасность (SASL/SSL)
Желательные:
- знание Python/Go/Bash для автоматизации
- опыт работы с on-premise или гибридными инфраструктурами
- автоматизация управления БД и брокерами сообщений с помощью Ansible, Puppet или собственных скриптов
- опыт работы с альтернативными брокерами (NATS, Pulsar)
3. Управление командой
- разработка и внедрение стратегии DevOps в компании
- постановка целей (OKR/KPI) для команды
- проведение 1:1, performance review, менторство
- разрешение конфликтов и мотивация команды
- взаимодействие с Product, Development, QA, Security командами
4. Soft Skills
- лидерские качества и ответственность за результат
- навыки переговоров и презентаций (обоснование решений перед руководством)
- умение работать в условиях неопределенности
- аналитическое мышление и data-driven подход
5. Бонусы
- опыт работы в highload-средах
- участие в DevOps-сообществе (доклады, статьи, opensource)
- сертификаты (Kubernetes CKA/CKAD, Linux Foundation)
Мы предлагаем:
-
настоящий опыт в построении новой инфраструктуры
-
оформление по ТК, оплата больничного и отпуска
-
добровольное медицинское страхование (ДМС) со стоматологией
-
возможность работать в офисе или удаленно
-
карьерный рост по разным направлениям
-
участие в конференциях и митапах, курсы повышения скиллов