Ключевые задачи:
-
Проектирование и разработка infrastructure для LLM/RAG pipeline на базе IaC (Terraform, Pulumi, Ansible);
-
Автоматизация deployment процессов для моделей, inference engines и data pipelines;
-
Управление конфигурациями для различных окружений (dev, staging, production);
-
Обеспечение reproducibility и версионирования infrastructure;
-
Развертывание и управление LLM inference, vector databases, backend сервисов в Kubernetes;
-
Конфигурирование deployments, statefulsets, services для оптимальной работы компонентов;
-
Настройка auto-scaling policies на основе CPU, memory, GPU метрик;
-
Управление persistent volumes для vector DB и кэша.
Навыки, которые нам необходимы:
-
3+ лет опыта с Kubernetes в production (deployment, scaling, networking, storage);
-
Глубокое понимание Kubernetes architecture, controllers, API objects;
-
Опыт с Helm для package management и templating;
-
Опыт с container runtime (Docker, Podman, containerd);
-
Знание networking и service discovery в Kubernetes;
-
3+ лет опыта с CI/CD pipelines (GitLab CI, Jenkins, GitHub Actions);
-
Опыт с artifact registry и container image management;
-
Знание deployment стратегий (rolling, canary, blue-green);
-
Опыт с pipeline troubleshooting и optimization.
То, что ждет вас в команде:
- Работа в стабильной и динамичной Компании;
- Карьерный рост;
- Добровольное медицинское страхование (ДМС);
- Материальная помощь по памятным событиям;
- Отпуск 28 дней;
- Яркая корпоративная жизнь.