RDP.RU

Системный архитектор ML

Не указана

Москва
Полная занятость
Удаленная работа
От 3 до 6 лет

Python
Базы данных
Математическая статистика
Математическое программирование
Big Data
DataLake
pandas
Numpy
DWH
Docker
Kubernetes
MLflow
Kubeflow
Spark
Hadoop
Flink

RDP - ведущий российский производитель сетевых решений.

Мы специализируемся на разработке инновационного программного обеспечения и программно-аппаратных комплексов для высокопроизводительной обработки сетевого трафика. Продукция компании широко востребована в сетях операторского класса, крупных предприятиях и Госсекторе.

Одна из ключевых особенностей нашей компании – поставка масштабируемых решений на базе нашего оборудования, интеграция с системами Заказчика и доработка продуктов под поставляемые решения.

Сейчас мы находимся в поиске Системного архитектора в команду ML.

Команда занимается:

Проверкой гипотез по детектированию приложений, сервисов в сетях оператора с использование ML подходов.
Разработкой ML pipline-ов для автоматизации процессов создания/обучения моделей.
Поиском и исследованием перспективных направлений в применение ML подходов для решения задач по детектированию трафика.

Чем предстоит заниматься:

Разработка и управление архитектурой Datalake и ML-кластера для обработки больших объемов данных (в частности, данных сетевого трафика) и обучения моделей машинного обучения;
Проектирование систем хранения данных, включая выбор баз данных;
Разработка ETL-процессов для сбора информации из различных источников, приведения их к нужному формату и загрузки в хранилище;
Выбор оптимальных технологий и инструментов для построения масштабируемых и отказоустойчивых распределенных систем, способных обрабатывать большие объемы данных в реальном времени;
Проектирование и развертывание инфраструктуры для хранения, обработки и анализа больших данных, включая выбор оборудования, программного обеспечения и облачных сервисов;
Взаимодействие с командами Data Science, Data Engineering и сетевыми аналитиками для выявления требований к инфраструктуре машинного обучения и данным;
Оптимизация существующих ML-моделей и адаптация к production среде;
Участие в разработке и внедрении процессов непрерывной интеграции и непрерывного развертывания (CI/CD) для ML-моделей;
Анализ требований заинтересованных сторон к исследованию больших данных;
Разработка технического задания на создание методической и технологической инфраструктуры больших данных.

Что мы от вас ожидаем:

Глубокие знания в области технологий сбора, хранения и обработки больших данных (DataLake, DWH);
Опыт проектирования модели данных DWH;
Опыт проектирования распределенных систем и кластеров;
Опыт проектирования систем обработки больших данных;
Опыт работы с технологиями контейнеризации и оркестрации: Docker, Kubernetes;
Опыт работы с инструментами управления ML-моделями: MLflow, Kubeflow;
Знание технологий обработки больших данных: Spark, Hadoop, Flink;
Понимание жизненного цикла ML-моделей: от сбора данных до развертывания и мониторинга;
Опыт работы с ML-алгоритмами и методами их оптимизации;
Умение проводить нагрузочное тестирование и оптимизацию производительности системы;
Знание принципов информационной безопасности и защиты данных.

Условия работы:

Работа в аккредитованной IT компании;
Трудоустройство в соответствии с ТК РФ;
Белая заработная плата (оклад обсуждаем с успешным кандидатом после прохождения технического интервью);
График работы: 5/2, гибкое начало рабочего дня (с 8:00 до 12:00);
Возможность работать удаленно или в гибриде;
Офис находится в БЦ "Трио" на метро Динамо (или мцд Гражданская);
И плюшки ниже :) ↴

Источник вакансии

Вернуться, к списку вакансий