
Прометей Лаб
Lead SRE и devops
- PostgreSQL
- СУБД
- ORACLE
- Kubernetes
- Администрирование серверов Linux
- DevOps
- MySQL
- Grafana
- NoSQL
- Docker
- Nginx
- Prometheus
О компании:
Прометей Лаб — молодая и динамично развивающаяся компания, основанная в феврале 2024 года. Мы обеспечиваем высокую доступность и надежность сервисов для наших клиентов, минимизируя риски простоев их бизнеса. Наша команда растет, и мы ищем профессионалов, готовых развиваться вместе с нами, работать с крупными клиентами и выстраивать долгосрочные отношения.
Наша миссия:
Для клиентов — гарантировать стабильность и отказоустойчивость их сервисов.
Для сотрудников — создавать условия для профессионального роста, проактивного подхода и высокого уровня сервиса.
Наши ценности:
✔️ Проактивность — предупреждаем проблемы, а не просто реагируем на них.
✔️ Саморазвитие — постоянное обучение и внедрение лучших мировых практик.
✔️ Профессионализм — честность, ответственность и прозрачность в работе.
✔️ Win-win-win — баланс интересов компании, сотрудников и клиентов.
Почему мы?
Мы не просто оказываем услуги — мы создаем сервис, который клиенты оценивают на 10/10. Наша команда — это профессионалы, которые умеют работать с ожиданиями, признавать ошибки и быстро их исправлять. Мы верим, что успех строится на доверии, прозрачности и постоянном развитии.
Требования:
- Опыт работы в DevOps/SRE/Cloud-ролях от 5+ лет
- Инфраструктура как код (IaC)
- CI/CD: Jenkins, GitLab CI
- Контейнеризация и оркестрация: Docker, Kubernetes, Helm
- Мониторинг и логи: Dynatrace, Prometheus, Grafana, ELK
Обязанности:
- Участие в планировании архитектуры и технологического стека стрима
- Контроль и выполнение KPI в области безопасности (Security, Compliance).
- Повышение observability систем, сокращение MTTR, capacity planning.
Миссия позиции:
Возглавить эксплуатацию и развитие ИТ-инфраструктуры проекта, обеспечивая её надежность, безопасность и масштабируемость. Управлять командой инженеров, внедрять лучшие практики и прокачивать технические процессы.
Ключевые обязанности:
✅ Контроль доступности и стабильности системы
— Гарантировать uptime критичных сервисов (SLA 99.9%+).
— Организовать мониторинг, алертинг и быстрое реагирование на инциденты.
— Анализировать источники обращений пользователей, аргументированно приоритизировать приоритеты дефектов.
✅ Развитие архитектуры и инфраструктуры
— Анализировать текущую ИТ-систему, выявлять слабые места.
— Проектировать отказоустойчивые и масштабируемые решения.
— Управлять миграциями, обновлениями и техническим долгом.
✅ Прокачка команды инженеров
— Руководить командой DevOps/SRE/системных администраторов.
— Внедрять культуру blameless postmortem и непрерывного улучшения.
— Развивать экспертизу команды: менторинг, обучение