RUTUBE

Инженер эксплуатации облака(K8S)

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет
  • OpenNebula
  • Kubernetes
  • Docker
  • Nomand
  • Podman
  • CI/CD

RUTUBE - крупнейший российский видеохостинг, где собраны различные категории видео: премьерные выпуски шоу и сериалов, прямые эфиры телеканалов, фильмы и мультфильмы, контент видеоблогеров.
Мы стремимся сделать лучший видеосервис на базе высокотехнологичных решений, исследований и аналитики, который позволит смотреть качественный лицензионный контент, адаптированный под каждого пользователя.

Сейчас нам требуется Инженер эксплуатации облака(K8S)

Задачи, которые будут на тебя возложены:

  • Проектирование и внедрение Kubernetes-кластеров;
  • Разработка архитектуры Kubernetes-кластера для облачной платформы OpenNebula;
  • Выбор и внедрение подходящих технологий для работы с контейнерами и микросервисами;
  • Планирование и настройка кластеров для обеспечения высокой доступности, надежности и производительности;
  • Настройка и поддержка Kubernetes;
  • Установка, настройка и управление кластерами Kubernetes;
  • Настройка и оптимизация работы контейнеров и микросервисов в Kubernetes;
  • Мониторинг и управление состоянием узлов и контейнеров в кластере Kubernetes;
  • Обеспечение отказоустойчивости и восстановления данных в случае сбоя;
  • Интеграция Kubernetes с OpenNebula;
  • Интеграция Kubernetes и других систем контейнеризации с платформой OpenNebula;
  • Настройка и управление контейнерами и микросервисами в OpenNebula с использованием Kubernetes;
  • Оптимизация процесса выделения и освобождения ресурсов в рамках облачной среды;
  • Автоматизация и оркестрация процессов контейнеризации;
  • Разработка и внедрение скриптов и автоматизированных процессов для управления контейнерами и микросервисами;
  • Использование инструментов оркестрации, таких как Helm, Argo CD, Flux, для автоматизации задач контейнеризации;
  • Интеграция систем контейнеризации с системами мониторинга и управления для обеспечения автоматического реагирования на события;
  • Мониторинг и диагностика контейнеров и микросервисов;
  • Мониторинг состояния контейнеров и микросервисов с использованием специализированных инструментов, таких как Prometheus, Grafana, Istio;
  • Диагностика и устранение проблем с производительностью, доступностью и надежностью контейнеров и микросервисов;
  • Проведение регулярных аудитов и проверок целостности данных;
  • Оптимизация производительности контейнеров и микросервисов;
  • Анализ и оптимизация производительности контейнеров и микросервисов для минимизации задержек и увеличения пропускной способности;
  • Настройка механизмов кэширования и репликации данных для улучшения производительности;
  • Выполнение нагрузочного тестирования и стресс-тестирования контейнеров и микросервисов для оценки их устойчивости к пиковым нагрузкам;
  • Резервное копирование и восстановление данных;
  • Организация и управление процессом резервного копирования данных в контейнерах и микросервисах;
  • Разработка и внедрение планов аварийного восстановления (Disaster Recovery) для минимизации времени простоя в случае катастрофических событий;
  • Тестирование процедур восстановления данных и проверка их работоспособности;
  • Документирование и отчетность;
  • Подготовка и ведение технической документации по контейнерам и микросервисам, включая схемы, инструкции и процедуры;
  • Составление отчетов о состоянии контейнеров и микросервисов, а также выполненных работах;
  • Ведение журнала изменений и инцидентов, связанных с контейнерами и микросервисами.

Ждем, что ты:

  • Минимум 3 года опыта работы с Kubernetes и другими системами контейнеризации (Docker, Podman, Nomad и др.);
  • Опыт работы с микросервисами и микросервисной архитектурой;
  • Опыт работы с оркестраторами контейнеров (Helm, Kubeflow, Linkerd и др.);
  • Опыт работы с облачными платформами, такими как OpenNebula, OpenStack, AWS, Azure или Google Cloud;
  • Участие в проектах по развертыванию и поддержке облачных инфраструктур;
  • Опыт работы с инструментами CI/CD (GitLab CI, Jenkins, GitHub Actions и др.);
  • Опыт работы с автоматизацией задач в Kubernetes (Helm, Argo CD, Flux и др.);
  • Опыт работы с инструментами мониторинга и анализа состояния контейнеров и микросервисов (Prometheus, Grafana, Istio);
  • Опыт работы с системами логирования и трассировки (Fluentd, ELK Stack, Jaeger и др.);
  • Опыт работы с защитой контейнеров и микросервисов (Istio, Calico, SPIFFE и др.);
  • Опыт работы с аутентификацией и авторизацией (RBAC, OAuth, JWT и др.);
  • Глубокое понимание архитектуры Kubernetes и принципов работы контейнеров;
  • Знание технологий оркестрации контейнеров (Pod, Deployment, StatefulSet и др.);
  • Знание микросервисной архитектуры и принципов работы с микросервисами;
  • Основы работы с OpenNebula, включая установку, настройку и управление контейнерами и микросервисами;
  • Понимание архитектуры OpenNebula и её взаимодействия с Kubernetes;
  • Знание возможностей и ограничений OpenNebula в контексте контейнеров и микросервисов;
  • Понимание принципов работы микросервисной архитектуры и лучших практик построения микросервисов;
  • Знание стандартов (gRPC, HTTP/2, REST) и протококов для взаимодействия микросервисов;
  • Знание фреймворков для разработки микросервисов (Go, Python, Node.js и др.);
  • Знание инструментов оркестрации (Helm, Argo CD, Flux и др.);
  • Знание инструментов автоматизации (Terraform, Ansible, Puppet и др.);
  • Знание методов непрерывной доставки (CI/CD) и управления изменениями (GitOps);
  • Знание инструментов мониторинга и анализа состояния контейнеров и микросервисов (Prometheus, Grafana, Istio);
  • Знание инструментов логирования и трассировки (Fluentd, ELK Stack, Jaeger и др.);
  • Знание механизмов защиты контейнеров и микросервисов (Istio, Calico, SPIFFE и др.);
  • Знание механизмов аутентификации и авторизации (RBAC, OAuth, JWT и др.);
  • Знание принципов IaC (Infrastructure as Code) и инструментария для автоматизации (Terraform, Ansible, Kubernetes Operators и др.);
  • Знание концепций и инструментов для автоматизации тестов (Unit Testing, Integration Testing, End-to-end Testing и др.);
  • Продвинутые знания операционной системы Linux, включая управление пользователями, правами доступа, файлами и процессами;
  • Опыт настройки и управления сетевыми службами в Linux (DNS, DHCP, NFS, SSH и др.);
  • Уверенное владение командной строкой и скриптовыми языками (Bash, Python);
  • Навыки диагностики и устранения проблем в Linux-системах;
  • Навыки ведения технической документации и составления отчетов;
  • Умение четко и понятно описывать технические решения и результаты работы.

Условия:

  • Опыт работы над крупнейшем видеосервисом страны;
  • Работу в команде профессионалов и творческих людей;
  • Достойный уровень дохода (обсуждается индивидуально с каждым кандидатом);
  • Оформим ДМС не дожидаясь окончания испытательного срока;
  • Скидки от компаний-партнеров;
  • Фрукты, сладости, вкуснейший кофе каждый день;
  • Гибкое начало рабочего дня (гибридный график работы);
  • Уютный офис с развитой инфраструктурой в 5 минутах от станции метро Сокол.