МТС

LLM/AI Engineer Python [МТС Линк]

Не указана
  • Москва
  • От 3 до 6 лет
  • Python
  • FastAPI
  • PostgreSQL
  • LLM

МТС Линк — это IT-компания, которая разрабатывает цифровые инструменты для коммуникации и командной работы, чтобы дать людям свободу в профессиональной и творческой деятельности.

Мы — часть ведущей экосистемы и топ-игрок на рынке, где амбиции получают масштаб для реализации, а идеи — ресурсы для воплощения.

Наши продукты: Встречи, Вебинары, Курсы, Чаты, Доски, Формы, COMDI.

Наш текущий стек: Python (FastAPI, asyncio, Pydantic) Redis, rabbitmq/kafka
БД: PostgreSQL, ClickHouse, Векторные БД Docker

Наша команда строит инструмент, который помогает людям меньше тратить времени на рутину в чатах, встречах и таск-трекерах. Используем возможности больших языковых моделей (LLM) для упрощения рабочих коммуникаций.

Задачи на этой роли:

  • Проектировать и разрабатывать Python-микросервисы для LLM-функций (суммаризация, авто-протоколы встреч, умные ответы в чатах, автозаполнение задач), обеспечивая масштабируемость и отказоустойчивость
  • Собирать и улучшать RAG-пайплайны: разбиение и нормализация документов, индексация во векторные БД, контроль свежести и прав доступа
  • Проектировать промпты и системные инструкции, схемы Structured Outputs, подключение инструментов/функций (tool use), маршрутизацию запросов между моделями
  • Строить наблюдаемость и оценку качества: офлайн/онлайн-эвалы, метрики латентности/стоимости, логирование и трассировка запросов
  • Оптимизировать качество, задержку и бюджет: кэширование и батчинг, управление контекстом и токен-бюджетом, выбор/фолбэк моделей, ретраи
  • Плотно взаимодействовать с ML, фронтендом и продуктом: формулировать гипотезы, запускать A/B-эксперименты

Мы ожидаем:

  • Опыт разработки более 5 лет
  • Опыт работы и/или понимание современных подходов LLM инженерии. RAG, Context engineering, промптинг, Structured Outputs, embeddings, SGR
  • Понимание архитектуры современных LLM, NLP, знание современных моделей и их отличий
  • Опыт работы с FastAPI и asyncio — понимаешь, как устроен асинхронный бэкенд

  • Знание Pydantic, PostgreSQL и Redis

  • Опыт работы с векторными базами данных (например, Qdrant, FAISS, Weaviate) или понимаешь, зачем они нужны

Мы предлагаем:

  • Адаптивные и гибкие процессы — мы быстро принимаем решения, тестируем гипотезы и ценим вклад каждого в общий результат

  • Работу в удобном формате — офис рядом с м.Таганская в Москве, гибридный формат или удалёнка

  • Гибкое начало рабочего дня — мы начинаем с 9-11 утра

  • Развитие по карьерному треку и обучения — корпоративные университет от МТС и онлайн-библиотека, скидки на изучение языков

  • ДМС со стоматологией с 1-го месяца работы — плюс скидка на страхование семьи и бесплатные консультации психолога, юриста, ЗОЖ- и финансового специалиста

  • Скидки на спорт — в том числе на абонементы у партнеров для занятий в 3 500 залах по России и другие программы

  • Доход на уровне рынка и четкую систему мотивации

  • Официальное оформление с первого рабочего дня