Обязанности:
- Дообучение и оптимизация LLM для задач семантического поиска
- Разработка и внедрение пайплайнов данных для подготовки, очистки и индексирования
- Реализация технологий RAG для интеграции корпоративных данных с моделями
- Оптимизация производительности и релевантности моделей
- Мониторинг работы моделей и их постоянное улучшение
- Участие в разработке функциональных требований, создании MVP и промышленных версий сервисов
Требования:
- Практический опыт работы в области машинного обучения, включая разработку и внедрение решений с использованием технологий искусственного интеллекта (ИИ-решений)
- Не менее 3-х лет опыта в проектировании и реализации пайплайнов данных
- Глубокое понимание работы и настройки языковых моделей (LLM)
- Опыт работы с векторными базами данных и технологиями Retrieval Augmented Generation (RAG)
- Знание методов fine-tuning языковых моделей
- Глубокое понимание процесса обучения и инференса нейронных сетей
- Владение современными инструментами для анализа данных и машинного обучения (Python, PyTorch, TensorFlow)
- Навыки работы с системами контроля версий (Git)
- Английский язык на базовом уровне для работы с документацией