Selecty

Observability DevOps Engineer

Не указана
  • Минск
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет
  • Zabbix
  • Terraform
  • Jenkins
  • Grafana
  • Kubernetes

Наш клиент - международная компания по производству и дистрибуции электроники - расширяет внутренний IT-департамент.
Мы ищем Observability DevOps Engineer, который будет проектировать и создавать прозрачную, масштабируемую и надежную инфраструктуру для трех ключевых внутренних проектов:

  • Global ERP

  • Local ERP

  • Websites

Что вы будете делать

  • Проектировать, развертывать и поддерживать платформы наблюдаемости, включая Zabbix, Grafana и Elastic Stack (Elasticsearch, Logstash, Kibana).

  • Внедрять и поддерживать метрики, логи, трассировки и синтетический мониторинг для инфраструктуры и приложений.

  • Интегрировать Prometheus, Alertmanager, Loki и OpenTelemetry для единого наблюдения, где это применимо.

  • Разрабатывать дашборды и логику оповещений для своевременного информирования о инцидентах и возможности принятия решений.

  • Поддерживать мониторинг Linux, Windows, сетевых устройств, приложений и облачных сервисов.

  • Автоматизировать развертывание и конфигурацию компонентов мониторинга с помощью Ansible, Terraform или Puppet.

  • Управлять шаблонами конфигураций и развертыванием хостов Zabbix через CI/CD пайплайны.

  • Использовать API и скрипты (Python, PowerShell, Bash) для сбора данных и автоматизации.

  • Сотрудничать с командами SRE, DevOps и IT Operations для повышения надежности системы и сокращения MTTR (Mean Time to Recovery).

  • Поддерживать актуальную документацию системы, стандарты мониторинга и runbooks.

  • Определять KPI, SLI, SLO и процессы измерения SLA совместно с владельцами сервисов.

Технологический стек

GitLab CI/CD, Jenkins, Grafana, Loki, Sentry, Zabbix, Hyper-V, Kubernetes, Terraform, Cloudflare, DB2, PostgreSQL, DigitalOcean

О вас

  • Опыт работы в DevOps или SRE более 4 лет

  • Сильный опыт в CI/CD автоматизации и Infrastructure as Code

  • Знание стандартных метрик на уровне железа, ОС и приложений

  • Понимание систем мониторинга и наблюдаемости

  • Опыт работы как в on-premise, так и в облачных средах

  • Хорошие коммуникативные навыки и проактивный, ориентированный на решение проблем подход