-
Автоматизация эксплуатации – автоматизация развертывания и управления инфраструктурой.
-
Мониторинг и алертинг – настройка и оптимизация систем наблюдаемости.
-
Оптимизация отказоустойчивости – разработка и поддержка механизмов масштабирования и резервирования.
-
Развитие инфраструктуры – управление облачными и on-prem решениями, базами данных и сетями.
-
Инцидент-менеджмент – анализ сбоев, устранение причин и повышение надежности сервисов.
- Интеграция сервисов – развитие системы взаимодействия между компонентами платформы.
-
Опыт администрирования linux-серверов (в нашем окружении используются Debian, Ubuntu, Fedora).
-
Знание основ сетевого стека, практический опыт настройки VPN (openvpn, wireguard, ipsec), обеспечения сетевой безопасности и балансировки трафика с помощью nginx, haproxy.
-
Умение применять инструменты troubleshooting для анализа и решения проблем в ОС, сетях, сервисах.
-
Навыки работы с Ansible и описания инфраструктуры как кода.
-
Опыт использования docker, docker compose, установка и конфигурирование docker engine, написание docker-файлов для безопасного и отказоустойчивого развёртывания приложений в контейнерах.
- Практика внедрения и поддержки следующих решений:
- Proxmox Virtual Environment
- Ceph
- OpenSearch
- Netbox
-
Знания в развёртывании и сопровождении блокчейн-нод.
-
Уверенные навыки работы с Zabbix, Sentry, OpenSearch для настройки метрик, оповещений и логирования.
-
Опыт проектирования стратегий резервного копирования, построения отказоустойчивых архитектур и обеспечения защиты данных.
-
Опыт администрирования баз данных (MySQL, PostgreSQL), настройка высокодоступных конфигураций.
-
Полностью удаленный формат работы;
-
График работы 5/2;
-
В предпраздничные дни рабочий день сокращается на 1 час;
-
Выходные дни во время государственных праздников (по РФ календарю);
-
Оплачиваемый отпуск продолжительностью 28 календарных дней в год;
-
Sick day в течение года, по согласованию с руководителем;
-
Участие в тимбилдингах, корпоративных вечеринках и других мероприятий.