Что предстоит делать:
-
Следить за работой платформы и ее окружения, выявлять аномалии в работе системы (с помощью Zabbix, Grafana, Prometheus/ELK).
-
Разбирать инциденты, связанные с софтом, сетью и оборудованием.
-
Самостоятельно устранять сбои в режиме реального времени, либо взаимодействуя с DevOps, разработкой и QA.
-
Обрабатывать данные в ClickHouse для поиска и выдачи решений.
-
Настраивать и оптимизировать мониторинг, алертинг и логирование.
-
Автоматизировать и оптимизировать рутинные процессы (с использованием Python).
Что важно:
-
Опыт работы в поддержке, аналитике, сопровождении ПО, DevOps или SRE.
-
Знание сетевых протоколов и технологий.
-
Знакомство с инструментами мониторинга (Prometheus, Grafana).
-
Опыт работы с Python и SQL для автоматизации и анализа.
-
Образование в области Computer Science, физики, математики или финансов.
-
Английский на уровне B2 и выше.
В зависимости от часового пояса, работа может включать ночные смены.
Мы предлагаем:
-
Работу в современной международной компании без бюрократии, устаревших систем и технического долга.
-
Отличные возможности для профессионального роста и самореализации.
-
Удалённый формат работы из любой точки мира.
-
Компенсацию медицинской страховки, спортивных активностей и профессионального обучения.