Робот Мия

Data Scientist

От 150 000 RUR
  • Новосибирск
  • Полная занятость
  • Полный день
  • От 1 года до 3 лет
  • Python
  • NLP
  • Английский язык
  • MySQL
  • C/C++
  • ML
  • NLU
  • Clickhouse

Привет!
Robotmia – продуктовая IT-компания, специализирующаяся на технологиях машинного обучения, искусственного интеллекта и понимания естественного языка. На рынке больше 7 лет и каждый год растет минимум в 2 раза.

Мы - сильное окружение из умных и приятных людей.
Наша команда ежедневно создает рабочее пространство, где каждый чувствует себя, как часть единого целого. Мы ценим самореализацию и инновации. У нас есть все возможности для раскрытия твоего потенциала, работая в команде профессионалов.

Основные продукты – "Голосовой ассистент" и "Модуль определения автоответчиков". С их помощью наши клиенты кратно увеличивают качество обслуживания своих пользователей и в разы сокращают расходы. А с операторов call-центров снимают скучную и рутинную работу.

Наши клиенты — российские компании из самых разных сфер (логистика, медицина, банковский сектор и другие). Многих из них ты можешь найти в ежегодном рейтинге Forbes “ТОП-200 крупнейших частных компаний России”.

Мы ищем талантливого и увлеченного Data Scientist, который будет заниматься исследовательской деятельностью, анализом данных и разработкой инновационных решений в области машинного обучения. Если ты любишь исследовать данные, находить скрытые закономерности и создавать модели, которые решают сложные задачи, то эта вакансия для тебя!

Чем предстоит заниматься:

- Проведение исследовательского анализа данных (EDA) для выявления закономерностей, трендов и аномалий.

- Постановка гипотез и задач на основе анализа данных и бизнес требований.

- Исследование и анализ аудиоданных визуализация и предобработка.

- Разработка и обучение моделей для классификации аудио (например, распознавание речи, классификация звуков, идентификация голосов).

- Создание и оптимизация моделей для коррекции аудио (шумоподавление, улучшение качества звука, разделение источников звука).

- Исследование и применение современных архитектур нейронных сетей для работы с аудиоданными (CNN, RNN, LSTM, Transformer, WaveNet и др.).

- Проведение экспериментов с различными подходами к обработке звука, включая временные и частотные методы.

- Интеграция обученных моделей в production-среду и их дообучение на новых данных.

- Анализ результатов работы моделей, интерпретация данных и подготовка отчетов.

- Постоянное изучение новых методов и технологий в области обработки аудиоданных и машинного обучения.

Мы ожидаем от тебя:

- Опыт работы в области Data Science или Machine Learning от 3 лет.

- Глубокое понимание основных алгоритмов машинного обучения и нейронных сетей.

- Опыт работы с библиотеками для анализа данных и машинного обучения: Pandas, NumPy, Scikit-learn, TensorFlow, PyTorch.

- Навыки программирования на Python.

- Знание библиотек для работы с аудиоданными (Librosa, PyAudio, torchaudio).

- Умение выбирать и настраивать архитектуры нейронных сетей для задач классификации и коррекции аудио (CNN, RNN, LSTM, Transformer и др.).

- Навыки работы с инструментами для CI/CD (например, Git, Docker, Kubernetes)

- Умение работать в команде и самостоятельно решать сложные задачи.

- Умение доводить задачи от постановки гипотезы до внедрения и сопровождения, включая работу с production-средой.

Будет плюсом:

- Опыт работы с моделями для обработки аудио, такими как WaveNet, Tacotron, Speech2Text, Voice Conversion.

- Знание методов шумоподавления, разделения источников звука (Source Separation) и улучшения качества аудио.

- Опыт работы с потоковыми данными и реальными production-системами.

- Участие в Kaggle-соревнованиях или наличие публичных проектов на GitHub.

- Знание методов оптимизации моделей (квантзация, pruning, дистилляция).

- Опыт работы с инструментами для управления ML-экспериментами (ClearML, MLflow, Weights & Biases).

Мы предлагаем:

  • Стабильную зарплату 2 раза в месяц, отпуска и больничные;

  • Креативную команду, которая решает инновационные задачи;

  • Удобный офис в Академгородке (2 мин. от станции Сеятель), возможный гибридный формат работы.

Мы не корпорация, наша стратегия основана на доверии и долгосрочных отношениях. Нам важно, чтобы новый человек был ответственным, вовлеченным и не боялся сложных задач.