Вам предстоит:
Создание чат ботов (RAG подход), настройка моделей LLM, выполнение задач полного цикла от постановки задачи, до деплоя моделей.
Ключевые компетенции и требования:
1. Опыт работы с Large Language Models (LLM):
- Практический опыт работы с современными LLM (GPT, Llama, Mistral, Claude и др.).
- Понимание архитектуры, возможностей и ограничений различных моделей.
2. Реализация RAG (Retrieval-Augmented Generation):
- Опыт проектирования и оптимизации RAG-систем для улучшения генеративных моделей.
- Умение работать с векторными базами данных (Pinecone, Weaviate, FAISS, Chroma и др.).
- Навыки интеграции retrieval-механизмов с генеративными моделями.
3. Разработка и улучшение AI-ассистентов:
- Опыт создания чат-ботов, виртуальных ассистентов и диалоговых систем на основе LLM.
- Оптимизация качества ответов, управление контекстом диалога, снижение галлюцинаций.
- Работа с инструментами оценки качества ассистентов (человеческая оценка, автоматические метрики).
4. Fine-Tuning LLM:
- Опыт дообучения и адаптации LLM под специфические задачи (LoRA, QLoRA, полный fine-tuning).
- Умение работать с фреймворками для тонкой настройки (Hugging Face Transformers, PyTorch, TensorFlow).
- Понимание методов эффективного обучения (distillation, quantization, RLHF).
5. Программирование и инструменты:
- Свободное владение Python и библиотеками для ML (PyTorch, TensorFlow, Hugging Face).
- Опыт работы с API LLM (OpenAI, Anthropic, локальные модели через Ollama, vLLM и др.).
- Знание SQL и NoSQL для работы с данными.
6. Обработка данных и инженерия признаков:
- Навыки предобработки текстовых данных (токенизация, нормализация, augmentation).
- Опыт работы с датасетами для NLP (разметка, балансировка, аугментация).
7. MLOps и деплой моделей:
- Опыт развертывания LLM в production (FastAPI, Flask, Docker, Kubernetes).
- Знание методов мониторинга и обслуживания моделей (логирование, A/B-тестирование).
Желательные навыки (плюсы):
- Разговорный уровень английского языка
- Опыт работы с мультимодальными моделями (текст + изображение/аудио).
- Знание методов оптимизации LLM (квантзация, pruning, ускорение инференса).
- Опыт работы с фреймворками для RLHF (например, TRL от Hugging Face).
- Участие в open-source проектах или публикации в NLP/ML.
Мы предлагаем:
- Работу в команде экспертов;
- Широкий технологический стек, сотни проектов;
- Гибкий график работы, который позволяет высыпаться и выделять время на хобби;
- Льготы и меры господдержки, предусмотренные для IT-компаний (аккредитованы Минцифры*);
- Возможность разрабатывать IT-решения для разных отраслей, пробовать новые технологии;
- У нас выстроены процессы удаленной работы, при этом есть просторные офисы с зонами коворкинга, где можно с комфортом пообщаться, поиграть в настолки или в тишине обдумать рабочие задачи;
- Возможность прокачаться во всех интересующих направлениях: стать тимлидом, архитектором, разработчиком full-stack;
- Развитую систему наставничества, сертификацию за счёт компании, участие в конференциях, изучение английского языка;
- Активный обмен опытом, внутренние и внешние митапы по разработке, хакатоны, доклады по развитию hard и soft skills;
- 50+ клубов по интересам и профессиональных сообществ внутри компании;
- Уютный мерч;
- Полный соцпакет и «белую» зарплату;
- Корпоративную базу знаний и социальную сеть для удобства общения с каждым из 1700+ сотрудников;
- Гибкую систему бонусов, которая настраивается под индивидуальные потребности: различные уровни ДМС, компенсация обучения или занятий любыми видами спорта;
- Заботу о ментальном здоровье: онлайн-консультации с психологом.
-
* Решение Министерства цифрового развития, связи и массовых коммуникаций РФ о предоставлении государственной аккредитации организации, осуществляющей деятельность в области информационных технологий от 10.03.2022 №АО-20220309-3771014210-3
Приходите в SimbirSoft за прокачкой хард-скиллов и интересными проектами!
Знаете кого-то, кто идеально сможет подойти? Расскажите им о нашей вакансии!