Т1

Data Scientist (NLP, LLM)

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет
  • NLP
  • ML
  • Linux
  • Python
  • Docker

Наша команда занимается разработкой и внедрением моделей машинного обучения для NLP/PLP/LLM и смежными задачами. ИИ для разработчиков, генерация кода, Fine-Tuning.

Задачи команды:

  • Улучшать и тестировать текущие модели с использованием SOTA или близких к ним подходов.
  • Разрабатывать модели машинного обучения в области NLP/PLP и смежных задач.
  • Развивать продукты по моделям-трансформерам.
  • Модернизировать устаревшие сервисы, интегрировать с API входящих запросов.
  • Строить пайплайны для моделей, подготавливать контейнеры.
  • Обеспечивать эффективности на всех этапах: данные, архитектура, обучение, квантизация, фреймворки деплоя.

Какой опыт и знания мы ожидаем:

  • Опыт работы в области NLP от 3 лет.
  • Высокий уровень математического аппарата - математический анализ, линейная алгебра, теория вероятностей.
  • Детальное понимание моделей машинного обучения и алгоритмов.
  • Высшее образование (IT, техническое).
  • Уверенное владение языком Python 3.х, будет плюсом: ООП, паттерны, Web, Clean code.
  • Знания Linux, bash, Docker.
  • Знание classic ML/NLP - инструментов (numpy, pandas, sklearn, nltk, spacy, pymorphy, natasha, regex и др.);
  • Опыт тюнинга моделей на различные задачи NLP (Question Answering, Code Search, Code Completion, Text Classification, POS Tagging, Machine Translation) и работы с эмбеддингами w2v, fastText, BERT, BM25 на PyTorch.
  • Опыт вывода ML/NLP моделей в production (gradio/streamlit, fastapi/flask, FastChat, vLLM, CTranslate, Ray, OpenLLM и др.).