Обязанности:
обучения нейронных сетей и больших языковых моделей:
Чем предстоит заниматься:
- Разработка и доработка моделей LLM под задачи рерайтинга текста, генерирования текста для презентаций и отчетов на основе имеющихся данных департамента, создания чат-бота для ответов по нормативным актам
- Fine-tuning моделей LLM для доменных задач
- Сбор, предобработка и анализ текстовых данных для обучения моделей
- Разработка и оптимизация RAG-подходов для улучшения работы языковых моделей с базами знаний
- Разбиение текста нормативных актов на чанки
- Выбор оптимального подхода к решению задач (ML или эвристики/статистика).
- Анализ результатов экспериментов и улучшение моделей
- Знания ML
- Python для работы с данными
- Docker
- Git
- Знания методов работы с текстовыми данными
-
Понимание принципов работы LLM, опыт inference, оптимизации, RAG
- Опыт работы с GPT, BERT
- Векторные БД: Опыт работы с векторными базами данных для RAG
- SQL и БД: Навыки SQL и опыт работы с базами данных
- Обсуждаются