Т1

Data Scientist (NLP, LLM)

Не указана

Москва
Полная занятость
Удаленная работа
От 3 до 6 лет

NLP
ML
Linux
Python
Docker

Наша команда занимается разработкой и внедрением моделей машинного обучения для NLP/PLP/LLM и смежными задачами. ИИ для разработчиков, генерация кода, Fine-Tuning.

Задачи команды:

Улучшать и тестировать текущие модели с использованием SOTA или близких к ним подходов.
Разрабатывать модели машинного обучения в области NLP/PLP и смежных задач.
Развивать продукты по моделям-трансформерам.
Модернизировать устаревшие сервисы, интегрировать с API входящих запросов.
Строить пайплайны для моделей, подготавливать контейнеры.
Обеспечивать эффективности на всех этапах: данные, архитектура, обучение, квантизация, фреймворки деплоя.

Какой опыт и знания мы ожидаем:

Опыт работы в области NLP от 3 лет.
Высокий уровень математического аппарата - математический анализ, линейная алгебра, теория вероятностей.
Детальное понимание моделей машинного обучения и алгоритмов.
Высшее образование (IT, техническое).
Уверенное владение языком Python 3.х, будет плюсом: ООП, паттерны, Web, Clean code.
Знания Linux, bash, Docker.
Знание classic ML/NLP - инструментов (numpy, pandas, sklearn, nltk, spacy, pymorphy, natasha, regex и др.);
Опыт тюнинга моделей на различные задачи NLP (Question Answering, Code Search, Code Completion, Text Classification, POS Tagging, Machine Translation) и работы с эмбеддингами w2v, fastText, BERT, BM25 на PyTorch.
Опыт вывода ML/NLP моделей в production (gradio/streamlit, fastapi/flask, FastChat, vLLM, CTranslate, Ray, OpenLLM и др.).

Источник вакансии

Вернуться, к списку вакансий