На этой позиции тебе предстоит:
- Проектировать, внедрять и поддерживать метрики, алерты, ранбуки и дашборды для мониторинга продукта
- Участвовать в устранении сбоев и расследовании их причин
- Повышать observability и надежность продукта
- Автоматизировать рутинную работу
Что мы ждем от кандидата:
- Понимаете SLO/SLI/SLA, умеете применять на практике
- Умеете работать с Linux на уровне системного администратора
- Понимаете, как устроено оборудование серверов
- Опыт работы с Grafana, Prometheus, Ansible
- Понимаете принципы построения CI/CD-пайплайнов и IaC-подхода
- Опыт обслуживания Ceph или других SDS, СХД
- Владеете языками программирования (Python, Go)
- Разбираетесь в устройстве сетей и умеете диагностировать их проблемы