
Бизнес Успех
Senior ML-инженер (Игровой ИИ)
Не указана
- Deep Reinforcement Learning (Deep Q-Learning, PPO, DDPG)
- Python
- ML-фреймворки: PyTorch, TensorFlow
- Q-Learning, PPO, DDPG, Actor-Critic
- Optuna, Hyperopt, Bayesian optimization
- Docker
- MLOps
О проекте:
Команда разрабатывает передовые игровые ИИ, способный обыгрывать профессионалов в различных дисциплинах. Система строится на самых современных подходах глубокого обучения и должна поддерживать работу в режиме реального времени с высокой производительностью.
Что нужно будет делать:
- Проектировать и реализовывать модели глубокого обучения на основе Deep Reinforcement Learning (Deep Q-Learning, PPO, DDPG), отвечать за их эффективность и производительность.
- Экспериментировать с архитектурами нейронных сетей (включая CNN, RNN, Transformer) и адаптировать их под специфику покерной задачи.
- Разрабатывать и поддерживать эффективные процессы автоматизированного обучения (self-play) и переобучения моделей в режиме реального времени.
- Оптимизировать производительность моделей, реализовывать инференс с минимальными задержками (менее 3 секунд на принятие решения в многопоточном режиме).
- Реализовывать алгоритмы оценки вероятностей и математического ожидания с высокой точностью (Монте-Карло, GTO-анализ).
- Настраивать pipeline автоматической оптимизации гиперпараметров с использованием Optuna и других современных решений.
- Интегрировать модели с игровой платформой и модулями обработки данных, взаимодействуя с backend-разработчиками и DevOps-командой.
- Организовывать мониторинг работы моделей, отслеживать метрики и стабилизировать работу системы в условиях высокой нагрузки.
- Внедрять best practices в области MLOps: контейнеризация (Docker), оркестрация (Kubernetes), и настройка процессов CI/CD.
Требуемый технический стек и навыки:
- Профессиональное владение Python, глубокое знание ML-фреймворков: PyTorch, TensorFlow.
- Отличные знания методов глубокого обучения и Reinforcement Learning (Q-Learning, PPO, DDPG, Actor-Critic).
- Опыт проектирования и оптимизации производительности нейросетей (CNN, RNN, Transformer) под задачи принятия решений в реальном времени.
- Практический опыт работы с GPU (CUDA) и распределённым обучением (PyTorch Distributed, TensorFlow Multi-GPU training).
- Уверенные знания и опыт работы с реляционными и колоночными базами данных (PostgreSQL, ClickHouse).
- Глубокий опыт работы с инструментами автоматического подбора гиперпараметров (Optuna, Hyperopt, Bayesian optimization).
- Понимание и внедрение процессов MLOps: опыт контейнеризации (Docker), работы с Kubernetes, GitHub Actions, Jenkins.
Мы предлагаем:
- Работу над интересным и амбициозным проектом (-ами).
- Возможность профессионального роста и обучения.
- Гибкий график и возможность удаленной работы.
- Конкурентную заработную плату и бонусы.
- Современный офис и дружный коллектив.