TokenSpot

SRE-инженер

Не указана

Чем предстоит заниматься:

Автоматизация эксплуатации – автоматизация развертывания и управления инфраструктурой.
Мониторинг и алертинг – настройка и оптимизация систем наблюдаемости.
Оптимизация отказоустойчивости – разработка и поддержка механизмов масштабирования и резервирования.
Развитие инфраструктуры – управление облачными и on-prem решениями, базами данных и сетями.
Инцидент-менеджмент – анализ сбоев, устранение причин и повышение надежности сервисов.
Интеграция сервисов – развитие системы взаимодействия между компонентами платформы.

Что для нас важно:

Опыт администрирования linux-серверов (в нашем окружении используются Debian, Ubuntu, Fedora).
Знание основ сетевого стека, практический опыт настройки VPN (openvpn, wireguard, ipsec), обеспечения сетевой безопасности и балансировки трафика с помощью nginx, haproxy.
Умение применять инструменты troubleshooting для анализа и решения проблем в ОС, сетях, сервисах.
Навыки работы с Ansible и описания инфраструктуры как кода.
Опыт использования docker, docker compose, установка и конфигурирование docker engine, написание docker-файлов для безопасного и отказоустойчивого развёртывания приложений в контейнерах.
Практика внедрения и поддержки следующих решений:

Знания в развёртывании и сопровождении блокчейн-нод.
Уверенные навыки работы с Zabbix, Sentry, OpenSearch для настройки метрик, оповещений и логирования.
Опыт проектирования стратегий резервного копирования, построения отказоустойчивых архитектур и обеспечения защиты данных.
Опыт администрирования баз данных (MySQL, PostgreSQL), настройка высокодоступных конфигураций.

Что мы предлагаем: