Обязанности:
-
Ведение полного цикла работы с данными: сбор, обработка, анализ данных от нескольких поставщиков;
-
Контроль качества данных: проверка корректности, полноты и непротиворечивости; поиск причин расхождений; формирование требований к выгрузкам/срезам данных;
-
Подготовка аналитических материалов;
-
Подготовка данных для ML: формирование обучающих/валидационных выборок, участие в разметке (постановка правил, контроль качества разметки);
-
Сопровождение и улучшение действующих ML‑моделей (тональность/атрибуты и др.): мониторинг метрик качества, анализ ошибок, дообучение/перенастройка, контроль качества релизов (преимущественно работа сконцентрирована на обработке текстовых данных (тональность\атрибуты) по темам сериалов, интернет контента, компьютерных игр);
-
Участие в разработке новых ML‑моделей для задач классификации/регрессии/кластеризации (преимущественно текст): постановка экспериментов, сравнение подходов, внедрение в рабочий процесс;
-
Автоматизация обработки данных и подготовки отчетности: развитие существующих скриптов/пайплайнов, повышение воспроизводимости расчетов.
Требования:
-
Высшее образование;
-
Владение Python для анализа данных и подготовки датасетов (pandas/numpy);
-
Опыт построения и контроля качества датасетов: очистка, дедупликация, стандартизация, сверка источников, работа с неполными данными;
-
Понимание классического ML и умение оценивать качество моделей: корректная валидация, выбор метрик (например, F1, ROC-AUC, MAE/RMSE), анализ ошибок, предотвращение утечек);
-
Навыки подготовки понятных аналитических отчетов и презентаций (PowerPoint/Word), грамотная письменная речь;
-
Самостоятельность в ведении задач, фиксация методики и результатов.
-
Будет плюсом: практический опыт работы с текстовыми данными: предобработка, признаки (TF‑IDF/эмбеддинги), обучение моделей для тональности/атрибутов или похожих задач.
Условия:
- Возможность стать участником социально-значимого проекта;
- Оформление по ТК РФ;
- График 5/2, c 10:00 до 19:00;
- Комфортный и современный офис;
- Подключение к ДМС после испытательно срока.