Клеркгрупп
Data Scientist
- Python
- PyTorch
- Numpy
- SciPy
- Scikit-learn
- OpenCV
- MongoDB
- PostgreSQL
- Clickhouse
- Kubernetes
- Gitlab
В связи с расширением команды и масштабированием проектов находимся в поиске Senior Data Scientist в IT-компанию, которая занимается разработкой и полным сопровождением заказного программного обеспечения, веб-сайтов и мобильных приложений, предоставляя широкий спектр услуг.
Технологии:
-
Python, NumPy, PyTorch, SciPy, scikit-learn, OpenCV, Triton MongoDB, PostgreSQL, S3 (Ceph), ClickHouse, Kafka Poetry, GitLab, Kubernetes, Argo Workflows, Kubeflow
Чем предстоит заниматься:
-
Работа с бизнес-стейкхолдерами - уточнение целей, перевод бизнес-задач в формальные ML- проблемы, оценка эффекта от внедрения моделей;
-
Исследование и оценка источников данных - поиск новых внутренних и внешних датасетов, анализ их качества, полноты и применимости к бизнес-целям; выявление недостающих данных и формирование требований к их сбору;
-
Разработка инструментов для подготовки обучающих датасетов - автоматизация сбора, очистки, разметки и обогащения данных; обеспечение воспроизводимости и масштабируемости процессов;
-
Проектирвоание, обучение, оценка и публикация моделей - выбор релевантных подходов, построение и оптимизация ML-решений, проведение экспериментов, контроль качества и интеграция моделей в продакшн-среду;
-
Продуктовая аналитика и эксперименты - формирование и проверка гипотез, проведение A/B- тестов, анализ результатов моделей и экспериментов в разрезе продуктовых метрик, предоставление бизнес-рекомендаций.
Наши ожидания от кандидата:
-
Опыт работы Data Scientist от 5 лет;
-
Глубокое владение Python - уверенное написание промышленного кода, понимание устройства интерпретатора, принципов памяти, асинхронности и параллелизма;
-
Отличные навыки SQL - уверенное владение сложными запросами, оконными функциями, оптимизацией и профилированием запросов;
-
Опыт работы с NoSQL-базами (например, MongoDB) и объектными хранилищами (S3, Ceph);
-
Знание и практическое применение классических алгоритмов машинного обучения (регрессия, деревья, бустинг, кластеризация и др.);
-
Глубокое понимание процессов обучения и инференса нейронных сетей;
-
Умение применять статистические методы для анализа данных, валидации гипотез, продуктовой аналитики;
-
Опыт полного цикла разработки ML-моделей - от подготовки датасетов до продакшн-деплоя;
-
Практический опыт с ML-инструментами: numpy, pandas, scipy, scikit-learn, pytorch, opencv, triton.
Плюсом будет:
-
Опыт data-аналитики и построения отчётности;
-
Опыт работы с Kubeflow;
-
Опыт обучения, интеграции или применения LLM;
-
Опыт создания и оптимизации RAG-систем.
Мы предлагаем:
- Оформление по ТК Республики Беларусь;
- Стабильную официальную заработную плату;
- Комфортный, современный офис в Минске либо удаленное сотрудничество;
- Расширенный социальный пакет.
Данное рабочее место является планируемым к созданию и замещению (перспективным).