Bercut

Data Scientist (ESB)

Не указана
  • Санкт-Петербург
  • Полная занятость
  • Полный день
  • От 3 до 6 лет

Компания Bercut, отечественный разработчик корпоративного ПО, приглашает Data Science специалиста для работы над интеграционной платформой ESB Bercut. Проект включает проектирование и поддержку инфраструктуры для маршрутов на Apache Camel, оптимизацию потоков данных через Kafka, настройку современных инструментов контейнеризации и обеспечение безопасности. У нас вы получите возможность влиять на инфраструктурные решения, работать в высокопрофессиональной команде и оптимизировать процессы доставки продукта.

основное в работе:

  • создавать начальный датасет промпт → yaml для маршрутов Camel (вручную + синтез);

  • разрабатывать пайплайн аннотации логов (аномалия, событие, причина);

  • проверять точность генерации OpenAPI и разрабатывать критерии оценки качества;

  • собирать embedding-корпус по документации ESB и Camel;

  • сравнивать Pinecone vs Qdrant на реальном retrieval latency и relevance;

  • проектировать логику агентов;

  • определять цепочки взаимодействия LLM (prompt flows, tools, context);

  • работать с LLM и RAG

  • участвовать в fine-tuning и выборе моделей

  • Передавать знания в dev-команду и ML-инфраструктуру.

для нас важно:

  • Python, Pandas, json, PyYAML, Jupyter;
  • обработка логов, YAML, XML, Camel DSL, markdown, .http файлы;
  • ML / LLMPrompt Engineering, RAG, LangChain, transformers;
  • OpenAI embeddings, SentenceTransformers, Pinecone, Qdrant;
  • metrics design (BLEU, cosine, factual score, hallucination);
  • синтез обучающих данных, jsonl, prompt-response sets;
  • manual + semi-auto markup workflows
  • Precision@k, F1, HitRate, Retrieval latency
  • seaborn / matplotlib, графы последовательностей
  • Git, Issues, PR review, Markdown

дополнительно оценим:

  • опыт с Apache Camel (чтение DSL, понимание маршрутов);

  • опыт участия в обучении моделей (LoRA, SFT);

  • знание LLM evaluation фреймворков (TruLens, DeepEval, Ragas);

  • навыки генерации synthetic datasets и/или использования OpenAI functions.

у нас:

  • участие в создании продуктовых решений международного уровня, ориентированных на эффективное ведение бизнеса для наших партнеров;
  • гибкое начало дня и возможность работать удаленно из любой точки на карте РФ;
  • просторный удобный офис у Финского залива;
  • ДМС со стоматологией для сотрудника и выгодные условия приобретения полисов ДМС и ВЗР (выезд за рубеж) для всей семьи;
  • выстроенная система наставничества с первого дня адаптации и обучение за счет компании: повышение экспертизы в разных продуктовых командах, внешние курсы, корпоративный университет и библиотеки, участие в IT-конференциях, в том числе в качестве спикера;
  • индивидуальный подход к выбору корпоративных льгот: спорт, изучение иностранных языков, здоровье, обучение (и для детей), профессиональная литература;
  • корпоративные тарифы на сотовую связь;
  • компенсация за использование личного оборудования для тех, кто работает дистанционно.