WaveAccess
Senior Data Scientist LLM
- Python
- SQL
- MS SQL
- Data Scientist
- Английский — B2 — Средне-продвинутый
WaveAccess is looking for a Data Scientist to join our team and work on diverse projects for international clients. You can solve real-world business problems using various data science techniques, modern technology stacks, and advanced methodologies.
Responsibilities:
- Work with multiple data sources - collect, clean, analyze, and interpret data to provide valuable insights (incl. semi-structured document data)
- Build end-to-end data processing pipelines in Dataiku (datasets, recipes, scenarios) with reproducible results
- Extract and normalize information from documents - parse PDF and DOCX, handle noisy layouts, tables, and mixed structures
- Formulate and defend hypotheses to address complex business challenges; run offline experiments and interpret results
- Develop and implement data-driven solutions using Python tools
- Integrate lightweight LLM prompting when it improves quality
- Implement agentic solutions
- Collaborate closely with cross-functional teams to understand client requirements and deliver impactful results
- Present achieved results clearly - metrics, limitations, next steps, business value
Requirements:
- At least 3 years of commercial development experience
- Work according to the American calendar, shifted working hours from 12:00 to 21:00.
- English - B2 or higher (Upper Intermediate)
- Proficiency in Python and practical experience with pandas and other standard data science tools
- Experience with LLM/RAG (pragmatic, lightweight implementations; evaluation and safety/quality checks) and Agentic systems
- Experience with document/text data processing in applied tasks (PDF/DOCX extraction, normalization)
- Experience in presenting achieved results (both technical and business stakeholders)
- Familiarity with classic machine-learning approaches and algorithms (scikit-learn)
Technical Skills:
- Python
- LLM/RAG
- LangChain (light usage - prompt orchestration / calling LLMs)
- Agentic systems (tool/pipeline orchestration patterns)
- pandas
- scikit-learn (sklearn)
- Classic NLP stack
- Basic SQL
Preferred Experience:
- Experience with production workflows in Dataiku (scenarios, automation, monitoring, packaging)
- Experience using data visualization tools to communicate insights effectively (Python or Dataiku)
- Familiarity with deployment and version control tools like Docker and Git
- Experience working in Agile development environments
What We Offer:
- Employment according to the Labor Code, including 100% payment of sick leave and vacation
- Medical coverage (DMS)
- Democratic leadership, flexible start of the working day
- Corporate training programs
- Abundant opportunities for self-realization, professional and career growth.
Вакансия на русском:
WaveAccess ищет Data Scientist, который присоединится к команде и будет работать над разноплановыми проектами для международных клиентов. Вам предстоит решать реальные бизнес-задачи с помощью методов data science, современных технологий и продвинутых подходов.
Обязанности:
-
Работа с разными источниками данных: сбор, очистка, анализ и интерпретация данных для получения полезных инсайтов (в том числе из полуструктурированных документов)
-
Построение сквозных пайплайнов обработки данных в Dataiku (датасеты, рецепты, сценарии) с воспроизводимыми результатами
-
Извлечение и нормализация данных из документов: парсинг PDF и DOCX, работа со «шумными» макетами, таблицами и смешанными структурами
-
Формулирование и защита гипотез для решения сложных бизнес-задач; проведение офлайн-экспериментов и анализ результатов
-
Разработка и внедрение data-driven решений с использованием Python
-
Использование LLM-промптинга там, где это действительно улучшает качество
-
Реализация агентных (agentic) решений
-
Тесное взаимодействие с командами разных направлений для понимания требований клиентов и получения значимых результатов
-
Чёткая презентация результатов: метрики, ограничения, дальнейшие шаги и бизнес-ценность
Требования:
-
От 3 лет коммерческого опыта разработки
-
Работа по американскому календарю, смещенне часы работы с 12:00 до 21:00
-
Английский язык — уровень B2 и выше (Upper-Intermediate)
-
Уверенное владение Python и практический опыт работы с pandas и другими стандартными инструментами data science
-
Опыт работы с LLM / RAG (прагматичные, лёгкие реализации; оценка качества и безопасность)
-
Опыт с агентными системами
-
Практический опыт обработки текстовых и документных данных (извлечение и нормализация данных из PDF/DOCX)
-
Опыт презентации результатов как технической, так и бизнес-аудитории
-
Знание классических алгоритмов и подходов машинного обучения (scikit-learn)
Технические навыки:
-
Python
-
LLM / RAG
-
LangChain (в лёгком формате — оркестрация промптов и вызовы LLM)
-
Агентные системы (оркестрация инструментов и пайплайнов)
-
pandas
-
scikit-learn
-
Классический NLP-стек
-
Базовый SQL
Будет плюсом:
-
Опыт работы с продакшн-процессами в Dataiku (сценарии, автоматизация, мониторинг, упаковка решений)
-
Опыт визуализации данных и презентации инсайтов (Python или Dataiku)
-
Знание инструментов деплоя и контроля версий (Docker, Git)
-
Опыт работы по Agile-методологиям
Мы предлагаем:
-
Работу в динамичной международной команде
-
Оформление по ТК, 100% оплату больничных и отпуска
-
Возможность сотрудничества через ИП или самозанятость
-
Участие в зарубежных и российских проектах
-
Медицинскую страховку со стоматологией
-
Необходимое оборудование для работы
-
Корпоративные программы обучения
-
Широкие возможности для самореализации, профессионального и карьерного роста
-
Демократичный подход к процессам и гибкое начало рабочего дня рабочего дня