Платформа ОФД

TL Data Scientist

До 459 000 RUR
  • Москва
  • Полная занятость
  • Полный день
  • Более 6 лет
  • BigData
  • Hadoop
  • Machine Learning
  • Python
  • Data Science

Платформа ОФД — аккредитованная IT-компания, крупнейший в России оператор фискальных данных. Мы анализируем рынок российского ритейла, используя данные из миллиардов магазинных чеков

На основе неструктурированных данных мы разрабатываем аналитические решения и инсайты, которые помогают бизнесу принимать обоснованные стратегические решения. Наши продукты используют производители товаров, крупные ритейлеры, финансовые организации и маркетинговые агентства

Компания является резидентом инновационного центра «Сколково», что подтверждает наш технологический уровень и значимость внедряемых решений

Что у нас есть:
  • Масштабные данные: каждый третий чек, пробиваемый в России, попадает к нам — 60 миллионов чеков ежедневно. В нашей базе содержится более 5 миллиардов SKU - огромные возможности для анализа и моделирования
  • Современная инфраструктура: несколько кластеров Hadoop, выделенные мощные машины для Data Scientists, включая GPU-ускорители для ресурсоёмких задач обучения моделей
  • Профессиональная команда: 3 Data Science, аналитики и асессоры
  • Официальное трудоустройство: работаем по Трудовому кодексу РФ. Заработная плата белая, своевременная и прозрачная
  • ДМС, включая амбулаторную помощь, стоматологию, госпитализацию, скорую помощь и телемедицинские консультации
  • Удобное расположение. Офис близко от м. Спортивная\МЦК Лужники
  • Гибкое начало рабочего дня и гибридный формат — сочетание офиса и удалённой работы
  • Комфорт в офисе: кухня, зона отдыха с тренажёром и массажным креслом, настольными играми, игровой приставкой и караоке
  • Активная корпоративная культура. Мероприятия, командные активности за счет компании
Наш стек:
Jupyterhub/PyCharm, python, стандартный python стек (pandas, numpy, sklearn, matplolib), fastext, torch, BERT, HuggingFace, MlFlow
Hadoop, Spark, Hive, PostgreSQL, ClickHouse, Zeppelin/IntelliJ, AirFlow, ElasticSearch, Apache Superset
GitLab, k8s, Docker, Jira, Confluence
Твоя роль: Team Lead Data Science

Ты возглавишь команду специалистов по анализу данных и машинному обучению, которая создает инновационные решения для ритейла и производства. Твоя миссия — превратить огромный массив данных о покупках, клиентах и товарах в ценные бизнес-инсайты, продукты и сервисы, которые помогут компаниям стать более эффективными и клиентоориентированными.

Задачи:
- Работа с текстовыми данными (NLP):
Разрабатывать и оптимизировать модели для классификации чековых наименований товаров и торговых точек. Ты научишь систему распознавать категории товаров, бренды и ключевые атрибуты (например, масса, объем, цвет, вкус) из описаний в чеках, а также классифицировать торговые точки по типам бизнеса.
- Автоматизация и обогащение данных:
Создавать автоматизированные решения для выделения товарных характеристик, метчинга чековых наименований с эталонными SKU и интеграции внешних данных (например, погоды, событий, трендов). Это повысит точность моделей и их способность учитывать реальный контекст.
- Прогнозирование спроса и продаж:
Строить модели, которые предсказывают будущие покупки на основе истории продаж, сезонности, погоды, событий и изменений рынка. Эти прогнозы помогут оптимизировать запасы, маркетинговые кампании и стратегии ценообразования.
- Персонализация и рекомендации:
Разрабатывать AI-сервисы для персонализированного взаимодействия с покупателями. Ты будешь предлагать клиентам релевантные товары, промо-предложения и бонусы, основываясь на их поведении, предпочтениях и внешних данных. Это повысит лояльность и увеличит продажи.
- Управление командой:
Руководить командой дата-сайентистов и младших аналитиков, помогая им решать сложные задачи, развивать навыки и достигать целей. Ты станешь ментором, организатором процессов и драйвером инноваций.

- Инновации и внедрение лучших практик:
Быть в курсе последних трендов в области искусственного интеллекта и машинного обучения. Ты внедришь современные инструменты и подходы для решения задач классификации, обогащения данных, продуктовой аналитики и построения рекомендательных систем.

Как это работает на практике?
Представь, что ты создаёшь экосистему, которая:
• Понимает покупателя: анализирует его историю покупок, предпочтения и поведение.
• Предлагает лучшие решения: Рекомендует товары, которые ему действительно нужны, или предлагает скидку на любимый бренд.
• Оптимизирует бизнес-процессы: Помогает ритейлерам и производителям лучше планировать закупки, управлять запасами и адаптироваться к изменениям рынка.
• Автоматизирует рутину: Освобождает время для команды за счет автоматизации задач по классификации, обработке данных и генерации инсайтов.

Почему это важно?
Твоя работа напрямую влияет на успех бизнеса и удовлетворенность клиентов. Ты не просто решаешь технические задачи — ты создаешь продукты, которые делают жизнь людей удобнее и приятнее. Например:
• Клиент получает идеальное предложение на свой любимый товар
• Ритейлер увеличивает продажи благодаря точным прогнозам и персонализации
• Производитель узнает, какие продукты будут популярны в следующем сезоне
Качества, которые тебе пригодятся:
  • Умение вдохновлять и направлять команду
  • Аналитический склад ума. Способность видеть связи между данными и бизнес-задачами
  • Знание современных методов машинного обучения, NLP и работы с большими данными
  • Желание создавать продукты, которые действительно нужны людям