АВИТО ТЕХ

Дежурный инженер мониторинга

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 1 года до 3 лет
  • Linux
  • Zabbix
  • Prometheus

Команда Incident & Problem Management помогает Авито повышать стабильность продукта, координирует работу множества команд, если возникают сбои, а также разрабатывает инструменты, которые снижают вероятность появления инцидентов и упрощают процесс решения проблем.

Вам предстоит:

- реагировать на алерты в мониторинге (например: в мессенджер пришло сообщение с инструкцией, необходимо выполнить её; в инструкции — «перевыкатить сервис» или «позвонить инженеру»);

- принимать новые микросервисы на мониторинг (команда разработки отправляет команде мониторинга реквест, сообщая, что хотела бы мониторить);

- проверять обновлённые конфигурации мониторинга (команд разработки много, править и актуализировать мониторинг может кто угодно; дежурный является аппрувером изменений);

- оперативно фиксировать и оповещать о крупных инцидентах;

- развивать существующие инструменты мониторинга.

Мы ждём, что вы:

- знаете Linux, умеете траблшутить проблемы с ОС и железом;

- имеете опыт с системами мониторинга уровня Zabbix, Prometheus, ELK, Grafana и другими;

- имеете опыт с Git и базовое понимание работы системы контроля версий.

Будет здорово, если вы:

- имеете опыт работы в сменном графике с ночными дежурствами.

Работа у нас — это:

- возможность реализовать свои идеи в проекте с многомиллионной аудиторией;

- талантливая команда, готовая поддержать ваши инициативы;

- мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы;

- прозрачная система премий, достойная зарплата — размер обсудим на собеседовании;

- личный бюджет на обучение, который можно тратить на книги, курсы и конференции;

- забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;

- компенсация расходов на питание;

- удалённая работа или замечательные офисы в Москве, Санкт-Петербурге, Казани и Самаре.