Мы — крупнейший маркетплейс с миллиардами изображений товаров и десятками миллионов пользователей ежедневно. Наша команда разрабатывает AI-решения, которые улучшают поиск, рекомендации, пользовательский опыт и внутренние процессы. Сейчас мы ищем Senior / Expert Computer Vision Engineer для усиления нашей команды.
Вам предстоит работать с передовыми методами Computer Vision, чтобы:
- Автоматизировать атрибуцию товаров (категория, цвет, стиль, бренд);
- Улучшать качество контента (обработка изображений и видео, детекция дефектов);
- Разрабатывать компоненты для основного и визуального поиска, систем рекомендаций, видеоаналитики и многого другого;
- Внедрять инновации: мультимодальные генеративные модели, виртуальные примерочные, 3D-анализ.
Что нужно делать
Разрабатывать и внедрять state-of-the-art модели CV:
-
Классификация, детекция, сегментация, OCR;
-
Генеративные модели (GANs, Diffusion) для улучшения изображений;
-
Мультимодальные системы (CLIP, BLIP) для анализа текста + изображений.
Оптимизировать production-пайплайны:
- Ускорение инференса (ONNX, TensorRT, квантизация);
- Масштабирование на миллиарды изображений.
Работать с данными:
- Сбор, аугментация, weak/semi-supervised learning;
- Active learning для эффективной разметки.
Тесно взаимодействовать с продуктом, аналитикой и бэкендом:
- Формулировать гипотезы, проводить A/B-тесты;
- Интегрировать модели в высоконагруженные сервисы.
Какой опыт и знания нужны
- Глубокие знания современных методов CV (ViT, Diffusion, Metric Learning);
- Опыт продакшн-внедрения (от обучения до масштабирования);
- Умение работать с большими данными (миллиарды изображений);
- Навыки оптимизации моделей (ускорение инференса, quantization);
- Готовность к исследовательским задачам + прикладному внедрению.
Будет плюсом
- Публикации на CVPR/ICCV/ECCV;
- Опыт с 3D-анализом (NeRF, виртуальные примерочные);
- Знание NLP для мультимодальных задач.
Наш стек технологий
- ML/CV: PyTorch, OpenCV.
- MLOps: MLflow, Airflow, Kubernetes, FastAPI.
- Инфраструктура: Spark, Kafka, Triton, S3.
- Метрики: Precision/Recall, mAP, FID, конверсии и GMV в онлайн-экспериментах.
Мы предлагаем
- Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
- Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
- Инновационные задачи: мультимодальные нейросети в высоко нагруженных системах, которыми пользуются десятки миллионов пользователей в день;
- Инфраструктура: Мощные GPU-кластеры, петабайты данных;
- Развитие: Конференции, курсы, внутренние митапы;
- Гибридный или удаленный формат работы с гибким началом рабочего дня;
- Бесплатное питание в наших офисах;
- Скидки на фитнес и образовательные программы.