Розничное направление ГК Невада
Инженер поддержки (Middle Production Support Engineer) в e-grocery
80 000 - 100 000 RUR
О проекте
Мы строим современную e-grocery платформу с нуля для крупнейшей мультиформатной сети Дальнего Востока.
Проект высоконагруженный, с микросервисной архитектурой, стриминговыми данными (Kafka) и активными релизами. Все сервисы напрямую влияют на продажи и работу магазинов.
Сейчас мы усиливаем команду эксплуатации, чтобы:
- снизить нагрузку на backend-разработчиков
- быстрее и стабильнее обрабатывать инциденты
- повысить качество релизов и мониторинга
Чем предстоит заниматься:
Инциденты и поддержка продакшена
- Обрабатывать инциденты в production по готовым инструкциям (runbook’ам)
- Проводить первичную диагностику:
- логи (ELK),
- метрики (Grafana),
- состояние сервисов,
- очереди Kafka (чтение и анализ)
- Собирать контекст и эскалировать сложные случаи разработчикам
- Вести коммуникацию по инцидентам с внутренними командами
- Участвовать в post-mortem разборе проблем
Релизы:
- Выполнять релизы сервисов по чек-листам
- Контролировать состояние системы после выкладки
- Проверять корректность работы мониторинга и алертов
(CI/CD настраивают и поддерживают разработчики)
Автоматизация:
- Писать простые скрипты и утилиты (Python / Bash) для:
- автоматизации типовых операций,
- ускорения диагностики,
- работы с логами и API,
- вспомогательных задач поддержки
- Улучшать существующие инструкции и runbook’и
Документация и процессы:
- Поддерживать актуальность эксплуатационной документации
- Помогать улучшать процессы реакции на инциденты
- Участвовать в стандартизации поддержки
Требования:
Обязательные
- Опыт работы в технической поддержке / эксплуатации / production support от 1–2 лет
- Уверенная работа с Linux
- Понимание принципов работы backend-систем и микросервисов
- Опыт анализа логов и метрик
- Базовые навыки Python и/или Bash для автоматизации
- Опыт работы с:
- системами мониторинга (Grafana),
- системами логирования (ELK или аналоги)
- Умение работать по инструкциям и чек-листам
- Внимательность, ответственность, стрессоустойчивость
Будет плюсом
- Опыт работы с Kafka (чтение, диагностика, анализ lag’ов)
- Понимание CI/CD процессов
- Опыт проведения backend-релизов
- Участие в post-mortem
- Опыт написания runbook’ов