Задачи, которые будут в твоих руках:
-
Руководство группой круглосуточного мониторинга (8 FTE) прикладного ПО и инфраструктуры;
-
Автоматизация и роботизация деятельности подразделения, приём типовых кейсов на поддержку от подразделений сопровождения (администраторов) 2L;
-
Выполнение обязанностей инцидент-менеджера: оперативное информирование руководства о сбоях и процессе их устранения, организация аварийных конференций и работ по решению критических инцидентов;
-
Подготовка аналитической отчётности по массовым инцидентам, ведение встреч еженедельного инцидент-контроля;
-
Взаимодействие с подразделениями эксплуатации и развития IT, с ключевыми бизнес-заказчиками по вопросам, касающимся решения массовых критических инцидентов / аварий и устранения их последствий;
-
Покрытие алертами всего, что может по какой то причине сломаться.
Что для этого нужно:
-
Опыт работы в IT от 3 лет, из них не менее 2х - в службах сопровождения прикладного ПО и бизнес-процессов (предпочтительно - в финтех-секторе (банки, МФО, вендоры ППО, системные интеграторы и т.п.);
-
Практический опыт организации и руководства подразделениями круглосуточного мониторинга ППО и инфраструктуры;
-
Опыт работы с Grafana, Prometheus, Zabbix, Loki/ELKELK
-
Навыки создания алертов используя PromQL, Git и Alertmanager
-
Навыки постановки новых информационных систем (КЕ) на мониторинг, подготовки и согласования с заказчиками требований к мониторингу ИС;
-
Опыт работы с основными современными операционными системами в объёме прикладного администратора Win / *nix (знание команд, обязательно навыки работы в консоли OS);
-
Знание SQL на уровне, достаточном для написания запросов по извлечению данных из БД сервисных систем IT;
-
Общее понимание основных компонент ППО и инфраструктуры, их назначения и принципов взаимодействия в современном IT-ландшафте крупных компаний;
-
Уверенные знания ITIL (v3 / v4): все основные сущности и производственные процессы IT;
-
Опыт работы в одной из промышленных трекинг-систем (Atlassian Jira & Confluence / HP ServiceManager / Redmine и т.п.);
-
Знакомство с платформами роботизации и Low-code-программирования, желателен опыт внедрения и практического использования одной из систем данного класса;
-
Навыки документирования деятельности, написания инструкций;
-
Опыт подбора и обучения персонала, наставничества.