- Активное участие в оценке и реализации ML\AI-проектов заказчиков в виде «on-premise» решений (без доступа в Internet внутри PRD-контура) на базе free open-source технологий.
- Дообучение крупных языковых моделей (LLM) под задачи заказчика – проведение fine-tuning предварительно обученных моделей на специализированных наборах данных для повышения их точности и полезности в конкретной предметной области.
- Построение решений на основе Retrieval-Augmented Generation (RAG) – интеграция механизмов поиска знаний в генеративные модели для обогащения ответов актуальной информацией из внутренних источников данных.
- Интеграция моделей в инфраструктуру заказчика (on‑premise) – развёртывание и оптимизация ML/AI-решений в среде клиента без доступа к Интернету, с учётом требований безопасности и ограничений продакшн-контура.
-
Использование фреймворков AI-агентов и инструментов – применение современных инструментов для расширения возможностей LLM, таких как LangChain (цепочки вызовов моделей и действий) и Model Context Protocol (MCP) от Anthropic для подключения моделей к внешним инструментам и данным.
-
Работа с векторными базами данных.
-
Взаимодействие с командами и заказчиками – совместная работа с коллегами и заказчиками для выявления требований, планирования ML/AI-решений и интеграции результатов в бизнес-процессы. Презентация результатов экспериментов, обучение пользователей и передача решений в эксплуатацию.
-
Документирование и развитие экспертизы – ведение технической документации по реализованным моделям и решениям; анализ актуальных тенденций в области ML/AI (новые модели, фреймворки, библиотеки) для постоянного улучшения подходов команды.
- Python 3.7+
- Inference: llama.cpp, Ollama, vLLM, TGI.
- AI-aгенты.
- Фреймворки: LangChain.
- Векторные СУБД: Qdrant, FAISS, Chroma, Milvus.
- RAG, KAG, CAG, GraphRAG.
- Фреймворки: PyTorch, TensorFlow, scikit-learn.
- Опыт мониторинга процесса обучения.
- Опыт работы с разметкой данных.
-
Официальное трудоустройство согласно ТК РФ в аккредитованную IT-компанию.
- Возможность работать удаленно из любого региона по московскому времени.
- Расширенный ДМС со стоматологией — 100% компенсация для сотрудников компании.
- Компенсация расходов на Интернет, питание.