СимбирСофт

Data Scientist (NLP)

Не указана
  • Санкт-Петербург
  • Полная занятость
  • Полный день
  • От 1 года до 3 лет

Вам предстоит:

Создание чат ботов (RAG подход), настройка моделей LLM, выполнение задач полного цикла от постановки задачи, до деплоя моделей.


Ключевые компетенции и требования:

1. Опыт работы с Large Language Models (LLM):

- Практический опыт работы с современными LLM (GPT, Llama, Mistral, Claude и др.).

- Понимание архитектуры, возможностей и ограничений различных моделей.

2. Реализация RAG (Retrieval-Augmented Generation):

- Опыт проектирования и оптимизации RAG-систем для улучшения генеративных моделей.

- Умение работать с векторными базами данных (Pinecone, Weaviate, FAISS, Chroma и др.).

- Навыки интеграции retrieval-механизмов с генеративными моделями.

3. Разработка и улучшение AI-ассистентов:

- Опыт создания чат-ботов, виртуальных ассистентов и диалоговых систем на основе LLM.

- Оптимизация качества ответов, управление контекстом диалога, снижение галлюцинаций.

- Работа с инструментами оценки качества ассистентов (человеческая оценка, автоматические метрики).

4. Fine-Tuning LLM:

- Опыт дообучения и адаптации LLM под специфические задачи (LoRA, QLoRA, полный fine-tuning).

- Умение работать с фреймворками для тонкой настройки (Hugging Face Transformers, PyTorch, TensorFlow).

- Понимание методов эффективного обучения (distillation, quantization, RLHF).

5. Программирование и инструменты:

- Свободное владение Python и библиотеками для ML (PyTorch, TensorFlow, Hugging Face).

- Опыт работы с API LLM (OpenAI, Anthropic, локальные модели через Ollama, vLLM и др.).

- Знание SQL и NoSQL для работы с данными.

6. Обработка данных и инженерия признаков:

- Навыки предобработки текстовых данных (токенизация, нормализация, augmentation).

- Опыт работы с датасетами для NLP (разметка, балансировка, аугментация).

7. MLOps и деплой моделей:

- Опыт развертывания LLM в production (FastAPI, Flask, Docker, Kubernetes).

- Знание методов мониторинга и обслуживания моделей (логирование, A/B-тестирование).

Желательные навыки (плюсы):

- Разговорный уровень английского языка

- Опыт работы с мультимодальными моделями (текст + изображение/аудио).

- Знание методов оптимизации LLM (квантзация, pruning, ускорение инференса).

- Опыт работы с фреймворками для RLHF (например, TRL от Hugging Face).

- Участие в open-source проектах или публикации в NLP/ML.

Мы предлагаем:

  • Работу в команде экспертов;
  • Широкий технологический стек, сотни проектов;
  • Гибкий график работы, который позволяет высыпаться и выделять время на хобби;
  • Льготы и меры господдержки, предусмотренные для IT-компаний (аккредитованы Минцифры*);
  • Возможность разрабатывать IT-решения для разных отраслей, пробовать новые технологии;
  • У нас выстроены процессы удаленной работы, при этом есть просторные офисы с зонами коворкинга, где можно с комфортом пообщаться, поиграть в настолки или в тишине обдумать рабочие задачи;
  • Возможность прокачаться во всех интересующих направлениях: стать тимлидом, архитектором, разработчиком full-stack;
  • Развитую систему наставничества, сертификацию за счёт компании, участие в конференциях, изучение английского языка;
  • Активный обмен опытом, внутренние и внешние митапы по разработке, хакатоны, доклады по развитию hard и soft skills;
  • 50+ клубов по интересам и профессиональных сообществ внутри компании;
  • Уютный мерч;
  • Полный соцпакет и «белую» зарплату;
  • Корпоративную базу знаний и социальную сеть для удобства общения с каждым из 1700+ сотрудников;
  • Гибкую систему бонусов, которая настраивается под индивидуальные потребности: различные уровни ДМС, компенсация обучения или занятий любыми видами спорта;
  • Заботу о ментальном здоровье: онлайн-консультации с психологом.
  • * Решение Министерства цифрового развития, связи и массовых коммуникаций РФ о предоставлении государственной аккредитации организации, осуществляющей деятельность в области информационных технологий от 10.03.2022 №АО-20220309-3771014210-3

    Приходите в SimbirSoft за прокачкой хард-скиллов и интересными проектами!

    Знаете кого-то, кто идеально сможет подойти? Расскажите им о нашей вакансии!