RUTUBE - крупнейший российский видеохостинг, где собраны различные категории видео: премьерные выпуски шоу и сериалов, прямые эфиры телеканалов, фильмы и мультфильмы, контент видеоблогеров.
Мы стремимся сделать лучший видеосервис на базе высокотехнологичных решений, исследований и аналитики, который позволит смотреть качественный лицензионный контент, адаптированный под каждого пользователя.
Сейчас нам требуется Инженер эксплуатации облака(K8S)
Задачи, которые будут на тебя возложены:
- Проектирование и внедрение Kubernetes-кластеров;
- Разработка архитектуры Kubernetes-кластера для облачной платформы OpenNebula;
- Выбор и внедрение подходящих технологий для работы с контейнерами и микросервисами;
- Планирование и настройка кластеров для обеспечения высокой доступности, надежности и производительности;
- Настройка и поддержка Kubernetes;
- Установка, настройка и управление кластерами Kubernetes;
- Настройка и оптимизация работы контейнеров и микросервисов в Kubernetes;
- Мониторинг и управление состоянием узлов и контейнеров в кластере Kubernetes;
- Обеспечение отказоустойчивости и восстановления данных в случае сбоя;
- Интеграция Kubernetes с OpenNebula;
- Интеграция Kubernetes и других систем контейнеризации с платформой OpenNebula;
- Настройка и управление контейнерами и микросервисами в OpenNebula с использованием Kubernetes;
- Оптимизация процесса выделения и освобождения ресурсов в рамках облачной среды;
- Автоматизация и оркестрация процессов контейнеризации;
- Разработка и внедрение скриптов и автоматизированных процессов для управления контейнерами и микросервисами;
- Использование инструментов оркестрации, таких как Helm, Argo CD, Flux, для автоматизации задач контейнеризации;
- Интеграция систем контейнеризации с системами мониторинга и управления для обеспечения автоматического реагирования на события;
- Мониторинг и диагностика контейнеров и микросервисов;
- Мониторинг состояния контейнеров и микросервисов с использованием специализированных инструментов, таких как Prometheus, Grafana, Istio;
- Диагностика и устранение проблем с производительностью, доступностью и надежностью контейнеров и микросервисов;
- Проведение регулярных аудитов и проверок целостности данных;
- Оптимизация производительности контейнеров и микросервисов;
- Анализ и оптимизация производительности контейнеров и микросервисов для минимизации задержек и увеличения пропускной способности;
- Настройка механизмов кэширования и репликации данных для улучшения производительности;
- Выполнение нагрузочного тестирования и стресс-тестирования контейнеров и микросервисов для оценки их устойчивости к пиковым нагрузкам;
- Резервное копирование и восстановление данных;
- Организация и управление процессом резервного копирования данных в контейнерах и микросервисах;
- Разработка и внедрение планов аварийного восстановления (Disaster Recovery) для минимизации времени простоя в случае катастрофических событий;
- Тестирование процедур восстановления данных и проверка их работоспособности;
- Документирование и отчетность;
- Подготовка и ведение технической документации по контейнерам и микросервисам, включая схемы, инструкции и процедуры;
- Составление отчетов о состоянии контейнеров и микросервисов, а также выполненных работах;
- Ведение журнала изменений и инцидентов, связанных с контейнерами и микросервисами.
Ждем, что ты:
- Минимум 3 года опыта работы с Kubernetes и другими системами контейнеризации (Docker, Podman, Nomad и др.);
- Опыт работы с микросервисами и микросервисной архитектурой;
- Опыт работы с оркестраторами контейнеров (Helm, Kubeflow, Linkerd и др.);
- Опыт работы с облачными платформами, такими как OpenNebula, OpenStack, AWS, Azure или Google Cloud;
- Участие в проектах по развертыванию и поддержке облачных инфраструктур;
- Опыт работы с инструментами CI/CD (GitLab CI, Jenkins, GitHub Actions и др.);
- Опыт работы с автоматизацией задач в Kubernetes (Helm, Argo CD, Flux и др.);
- Опыт работы с инструментами мониторинга и анализа состояния контейнеров и микросервисов (Prometheus, Grafana, Istio);
- Опыт работы с системами логирования и трассировки (Fluentd, ELK Stack, Jaeger и др.);
- Опыт работы с защитой контейнеров и микросервисов (Istio, Calico, SPIFFE и др.);
- Опыт работы с аутентификацией и авторизацией (RBAC, OAuth, JWT и др.);
- Глубокое понимание архитектуры Kubernetes и принципов работы контейнеров;
- Знание технологий оркестрации контейнеров (Pod, Deployment, StatefulSet и др.);
- Знание микросервисной архитектуры и принципов работы с микросервисами;
- Основы работы с OpenNebula, включая установку, настройку и управление контейнерами и микросервисами;
- Понимание архитектуры OpenNebula и её взаимодействия с Kubernetes;
- Знание возможностей и ограничений OpenNebula в контексте контейнеров и микросервисов;
- Понимание принципов работы микросервисной архитектуры и лучших практик построения микросервисов;
- Знание стандартов (gRPC, HTTP/2, REST) и протококов для взаимодействия микросервисов;
- Знание фреймворков для разработки микросервисов (Go, Python, Node.js и др.);
- Знание инструментов оркестрации (Helm, Argo CD, Flux и др.);
- Знание инструментов автоматизации (Terraform, Ansible, Puppet и др.);
- Знание методов непрерывной доставки (CI/CD) и управления изменениями (GitOps);
- Знание инструментов мониторинга и анализа состояния контейнеров и микросервисов (Prometheus, Grafana, Istio);
- Знание инструментов логирования и трассировки (Fluentd, ELK Stack, Jaeger и др.);
- Знание механизмов защиты контейнеров и микросервисов (Istio, Calico, SPIFFE и др.);
- Знание механизмов аутентификации и авторизации (RBAC, OAuth, JWT и др.);
- Знание принципов IaC (Infrastructure as Code) и инструментария для автоматизации (Terraform, Ansible, Kubernetes Operators и др.);
- Знание концепций и инструментов для автоматизации тестов (Unit Testing, Integration Testing, End-to-end Testing и др.);
- Продвинутые знания операционной системы Linux, включая управление пользователями, правами доступа, файлами и процессами;
- Опыт настройки и управления сетевыми службами в Linux (DNS, DHCP, NFS, SSH и др.);
- Уверенное владение командной строкой и скриптовыми языками (Bash, Python);
- Навыки диагностики и устранения проблем в Linux-системах;
- Навыки ведения технической документации и составления отчетов;
- Умение четко и понятно описывать технические решения и результаты работы.
Условия:
- Опыт работы над крупнейшем видеосервисом страны;
- Работу в команде профессионалов и творческих людей;
- Достойный уровень дохода (обсуждается индивидуально с каждым кандидатом);
- Оформим ДМС не дожидаясь окончания испытательного срока;
- Скидки от компаний-партнеров;
- Фрукты, сладости, вкуснейший кофе каждый день;
- Гибкое начало рабочего дня (гибридный график работы);
- Уютный офис с развитой инфраструктурой в 5 минутах от станции метро Сокол.