Бизнес Успех

Senior ML-инженер (Игровой ИИ)

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет
  • Deep Reinforcement Learning (Deep Q-Learning, PPO, DDPG)
  • Python
  • ML-фреймворки: PyTorch, TensorFlow
  • Q-Learning, PPO, DDPG, Actor-Critic
  • Optuna, Hyperopt, Bayesian optimization
  • Docker
  • MLOps

О проекте:
Команда разрабатывает передовые игровые ИИ, способный обыгрывать профессионалов в различных дисциплинах. Система строится на самых современных подходах глубокого обучения и должна поддерживать работу в режиме реального времени с высокой производительностью.

Что нужно будет делать:

  • Проектировать и реализовывать модели глубокого обучения на основе Deep Reinforcement Learning (Deep Q-Learning, PPO, DDPG), отвечать за их эффективность и производительность.
  • Экспериментировать с архитектурами нейронных сетей (включая CNN, RNN, Transformer) и адаптировать их под специфику покерной задачи.
  • Разрабатывать и поддерживать эффективные процессы автоматизированного обучения (self-play) и переобучения моделей в режиме реального времени.
  • Оптимизировать производительность моделей, реализовывать инференс с минимальными задержками (менее 3 секунд на принятие решения в многопоточном режиме).
  • Реализовывать алгоритмы оценки вероятностей и математического ожидания с высокой точностью (Монте-Карло, GTO-анализ).
  • Настраивать pipeline автоматической оптимизации гиперпараметров с использованием Optuna и других современных решений.
  • Интегрировать модели с игровой платформой и модулями обработки данных, взаимодействуя с backend-разработчиками и DevOps-командой.
  • Организовывать мониторинг работы моделей, отслеживать метрики и стабилизировать работу системы в условиях высокой нагрузки.
  • Внедрять best practices в области MLOps: контейнеризация (Docker), оркестрация (Kubernetes), и настройка процессов CI/CD.

Требуемый технический стек и навыки:

  • Профессиональное владение Python, глубокое знание ML-фреймворков: PyTorch, TensorFlow.
  • Отличные знания методов глубокого обучения и Reinforcement Learning (Q-Learning, PPO, DDPG, Actor-Critic).
  • Опыт проектирования и оптимизации производительности нейросетей (CNN, RNN, Transformer) под задачи принятия решений в реальном времени.
  • Практический опыт работы с GPU (CUDA) и распределённым обучением (PyTorch Distributed, TensorFlow Multi-GPU training).
  • Уверенные знания и опыт работы с реляционными и колоночными базами данных (PostgreSQL, ClickHouse).
  • Глубокий опыт работы с инструментами автоматического подбора гиперпараметров (Optuna, Hyperopt, Bayesian optimization).
  • Понимание и внедрение процессов MLOps: опыт контейнеризации (Docker), работы с Kubernetes, GitHub Actions, Jenkins.

Мы предлагаем:

  • Работу над интересным и амбициозным проектом (-ами).
  • Возможность профессионального роста и обучения.
  • Гибкий график и возможность удаленной работы.
  • Конкурентную заработную плату и бонусы.
  • Современный офис и дружный коллектив.