Cloud.ru

NLP Engineer (Data Science)

Не указана
  • Москва
  • Полная занятость
  • Полный день
  • От 1 года до 3 лет

Обязанности:

  • Разработка и внедрение систем на основе Retrieval-Augmented Generation (RAG) для улучшения качества генерации текста.
  • Проектирование и реализация агентных систем, способных взаимодействовать с пользователями и выполнять сложные задачи. Исследование и внедрение новых технологий и подходов в агентных системах.
  • Работа в тесном сотрудничестве с командами разработчиков, аналитиков и других специалистов для интеграции NLP решений в продукты компании.
  • Создание внутренних бенчмарков для систем RAG и агентных систем.
  • Проведение тестирования и валидации моделей, а также анализ их производительности.
  • Дообучение open-source моделей для RAG и агентных систем.

Требования:

  • Опыт 2+ лет в NLP/ML;
  • Работа с RAG;
  • Понимание различных архитектур RAG, этапов retrieval и reranking;
  • Знание методов обучения каждого из этапов (langchain, llamaindex);
  • Fine-tuning LLM (PyTorch, transformers);
  • Построение агентных и мультиагентных систем (langchain/langgraph/langfuse, smol-agents, openai swarm);
  • Экспертиза в бэкенде для ML и облачных технологиях.

Будет плюсом:

  • Понимание DevOps процессов (выкатка на k8s, мониторинг, алертинг);
  • Опыт работы с Docker, виртуальными машинами, k8s;
  • Опыт Inference моделей (FastApi/KServe/TorchServe/Nvidia Triton/vLLM/SgLang);
  • Навыки инженера-новатора:
  • Опыт в ML System Design;
  • Умение принимать решения в условиях неопределенности (стартап-среда).