Cloud.ru

SRE - инженер (storage)

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет

На этой позиции тебе предстоит:

  • Проектировать, внедрять и поддерживать метрики, алерты, ранбуки и дашборды для мониторинга продукта
  • Участвовать в устранении сбоев и расследовании их причин
  • Повышать observability и надежность продукта
  • Автоматизировать рутинную работу

Что мы ждем от кандидата:

  • Понимаете SLO/SLI/SLA, умеете применять на практике
  • Умеете работать с Linux на уровне системного администратора
  • Понимаете, как устроено оборудование серверов
  • Опыт работы с Grafana, Prometheus, Ansible
  • Понимаете принципы построения CI/CD-пайплайнов и IaC-подхода
  • Опыт обслуживания Ceph или других SDS, СХД
  • Владеете языками программирования (Python, Go)
  • Разбираетесь в устройстве сетей и умеете диагностировать их проблемы