Ключевые задачи:
- Проектирование асинхронных, масштабируемых API для взаимодействия с RAG pipeline, LLM inference engine и vector databases;
- Реализация оптимальной обработки запросов с минимизацией времени ответа для crítica операций (retrieval, ranking, generation);
- Управление версионированием API для обеспечения backward compatibility и плавного внедрения новых фич;
- Интеграция и управление inference фреймворками (vLLM, Ollama, TGI, LocalAI) для высокопроизводительного обслуживания LLM запросов;
- Разработка абстракционного слоя для взаимодействия с vector databases (Qdrant, Weaviate, ChromaDB, pgvector);
- Разработка secure authentication механизмов (JWT, OAuth2, OIDC) для API endpoints.
Навыки, которые нам необходимы:
- 4+ лет опыта в Backend Development с фокусом на high-load systems;
- Глубокое понимание асинхронного программирования и concurrent systems;
- Опыт проектирования и разработки REST API на production уровне (minimum 2+ deployed projects);
- Знание основных паттернов: MVC, layered architecture, microservices;
- Experience с масштабируемыми backend архитектурами для обработки high volume requests.
То, что ждет вас в команде:
- Работа в стабильной и динамичной Компании;
- Карьерный рост;
- Добровольное медицинское страхование (ДМС);
- Материальная помощь по памятным событиям;
- Отпуск 28 дней;
- Яркая корпоративная жизнь.