Наша команда занимается разработкой и внедрением моделей машинного обучения для NLP/PLP/LLM и смежными задачами. ИИ для разработчиков, генерация кода, Fine-Tuning.
Задачи команды:
- Улучшать и тестировать текущие модели с использованием SOTA или близких к ним подходов.
- Разрабатывать модели машинного обучения в области NLP/PLP и смежных задач.
- Развивать продукты по моделям-трансформерам.
- Модернизировать устаревшие сервисы, интегрировать с API входящих запросов.
- Строить пайплайны для моделей, подготавливать контейнеры.
- Обеспечивать эффективности на всех этапах: данные, архитектура, обучение, квантизация, фреймворки деплоя.
Какой опыт и знания мы ожидаем:
- Опыт работы в области NLP от 3 лет.
- Высокий уровень математического аппарата - математический анализ, линейная алгебра, теория вероятностей.
- Детальное понимание моделей машинного обучения и алгоритмов.
- Высшее образование (IT, техническое).
- Уверенное владение языком Python 3.х, будет плюсом: ООП, паттерны, Web, Clean code.
- Знания Linux, bash, Docker.
- Знание classic ML/NLP - инструментов (numpy, pandas, sklearn, nltk, spacy, pymorphy, natasha, regex и др.);
- Опыт тюнинга моделей на различные задачи NLP (Question Answering, Code Search, Code Completion, Text Classification, POS Tagging, Machine Translation) и работы с эмбеддингами w2v, fastText, BERT, BM25 на PyTorch.
- Опыт вывода ML/NLP моделей в production (gradio/streamlit, fastapi/flask, FastChat, vLLM, CTranslate, Ray, OpenLLM и др.).