Привет!
Robotmia – продуктовая IT-компания, специализирующаяся на технологиях машинного обучения, искусственного интеллекта и понимания естественного языка. На рынке больше 7 лет и каждый год растет минимум в 2 раза.
Мы - сильное окружение из умных и приятных людей.
Наша команда ежедневно создает рабочее пространство, где каждый чувствует себя, как часть единого целого. Мы ценим самореализацию и инновации. У нас есть все возможности для раскрытия твоего потенциала, работая в команде профессионалов.
Основные продукты – "Голосовой ассистент" и "Модуль определения автоответчиков". С их помощью наши клиенты кратно увеличивают качество обслуживания своих пользователей и в разы сокращают расходы. А с операторов call-центров снимают скучную и рутинную работу.
Наши клиенты — российские компании из самых разных сфер (логистика, медицина, банковский сектор и другие). Многих из них ты можешь найти в ежегодном рейтинге Forbes “ТОП-200 крупнейших частных компаний России”.
Мы ищем талантливого и увлеченного Data Scientist, который будет заниматься исследовательской деятельностью, анализом данных и разработкой инновационных решений в области машинного обучения. Если ты любишь исследовать данные, находить скрытые закономерности и создавать модели, которые решают сложные задачи, то эта вакансия для тебя!
Чем предстоит заниматься:
- Проведение исследовательского анализа данных (EDA) для выявления закономерностей, трендов и аномалий.
- Постановка гипотез и задач на основе анализа данных и бизнес требований.
- Исследование и анализ аудиоданных визуализация и предобработка.
- Разработка и обучение моделей для классификации аудио (например, распознавание речи, классификация звуков, идентификация голосов).
- Создание и оптимизация моделей для коррекции аудио (шумоподавление, улучшение качества звука, разделение источников звука).
- Исследование и применение современных архитектур нейронных сетей для работы с аудиоданными (CNN, RNN, LSTM, Transformer, WaveNet и др.).
- Проведение экспериментов с различными подходами к обработке звука, включая временные и частотные методы.
- Интеграция обученных моделей в production-среду и их дообучение на новых данных.
- Анализ результатов работы моделей, интерпретация данных и подготовка отчетов.
- Постоянное изучение новых методов и технологий в области обработки аудиоданных и машинного обучения.
Мы ожидаем от тебя:
- Опыт работы в области Data Science или Machine Learning от 3 лет.
- Глубокое понимание основных алгоритмов машинного обучения и нейронных сетей.
- Опыт работы с библиотеками для анализа данных и машинного обучения: Pandas, NumPy, Scikit-learn, TensorFlow, PyTorch.
- Навыки программирования на Python.
- Знание библиотек для работы с аудиоданными (Librosa, PyAudio, torchaudio).
- Умение выбирать и настраивать архитектуры нейронных сетей для задач классификации и коррекции аудио (CNN, RNN, LSTM, Transformer и др.).
- Навыки работы с инструментами для CI/CD (например, Git, Docker, Kubernetes)
- Умение работать в команде и самостоятельно решать сложные задачи.
- Умение доводить задачи от постановки гипотезы до внедрения и сопровождения, включая работу с production-средой.
Будет плюсом:
- Опыт работы с моделями для обработки аудио, такими как WaveNet, Tacotron, Speech2Text, Voice Conversion.
- Знание методов шумоподавления, разделения источников звука (Source Separation) и улучшения качества аудио.
- Опыт работы с потоковыми данными и реальными production-системами.
- Участие в Kaggle-соревнованиях или наличие публичных проектов на GitHub.
- Знание методов оптимизации моделей (квантзация, pruning, дистилляция).
- Опыт работы с инструментами для управления ML-экспериментами (ClearML, MLflow, Weights & Biases).
Мы предлагаем:
-
Стабильную зарплату 2 раза в месяц, отпуска и больничные;
-
Креативную команду, которая решает инновационные задачи;
-
Удобный офис в Академгородке (2 мин. от станции Сеятель), возможный гибридный формат работы.
Мы не корпорация, наша стратегия основана на доверии и долгосрочных отношениях. Нам важно, чтобы новый человек был ответственным, вовлеченным и не боялся сложных задач.