-
Мониторинг доступности IT систем и реализация отказоустойчивости
-
Проведение исследования, диагностики и решение клиентских запросов на уровне 2-й линии поддержки.
-
Моделирование ошибок и анализ выявленных проблем с функционированием сервисов.
-
Формирование постановки задач разработчикам по устранению выявленных ошибок или доработок ПО.
-
Разработка/доработка документации.
-
Работа с Docker, Kubernetes
-
Поддержка работоспособности приложений развернутых в Kubernetes
-
Анализ и устранение ошибок в работе системы и выявление возможных рисков.
-
Работа с система мониторинга Prometheus Grafana, Zabbix - Создание новых и улучшение существующих дэшбордов.
-
Анализ, доработка и написание алертов.
-
Коммуникация с командами разработки.
-
Администрирование серверов linux
-
Работа с СУБД: PostgreSQL.
-
Мониторинг и полное понимание принципа и механизма работы Kafka, Redis, JVM bundle.
-
Автоматизация рутинных ручных задач.
-
Опыт работы на позиции DevOps/SRE-инженера от 2 лет;
-
Уверенные знания Linux (на уровне администратора);
-
Опыт работы с контейнеризацией (Docker, Kubernetes);
-
Знание инструментов CI/CD (Jenkins, GitLab CI, ArgoCD и др.);
-
Навыки работы с системами мониторинга и логирования (Prometheus, Grafana, ELK, Zabbix и др.);
-
Опыт написания скриптов (Bash, Python);
-
Знание систем контроля версий (Git);
-
Базовое понимание сетевых технологий и принципов безопасности;
-
Опыт взаимодействия с базами данных (PostgreSQL, Redis, Kafka).
Что мы предлагаем:
-
Официальное трудоустройство по ТК РК.
-
4 дня офис, 1 день удаленная работа.
-
Возможность влиять на процесс и результат.