Мастерская инструментов разработки

Разработчик AI

Не указана
  • Санкт-Петербург
  • Полная занятость
  • Удаленная работа
  • Более 6 лет

Мы в поиске Специалиста на проект по исследованию в области ИИ (оптимизация моделей глубокого обучения на edge-платформах).

Задача: участие в разработке техники сжатия моделей и квантования для повышения производительности AI-задач на устройствах с ограниченными ресурсами.

Обязанности

  • Исследовать и внедрять QAT/PTQ, эффективные алгоритмы инференса с фокусом на латентность, память и энергопотребление.

  • Работать с PyTorch, ONNX Runtime, TVM для развертывания моделей.

  • Сотрудничать с hardware-инженерами edge NPU.

  • Исследовать производительность и отслеживать тренды в AI efficiency и acceleration.

Требования

  • Знания и опыт в машинном обучении, оптимизации.

  • Опыт QAT/PTQ, mixed precision; Python/C++/CUDA/OpenCL; фреймворки (PyTorch/TensorFlow/ONNX/TVM/TensorRT).

  • Знание аппаратных ускорителей (SIMD/AVX/Tensor Cores) и компиляторных оптимизаций (XLA/MLIR/LLVM).

Умение общаться на английском обязательно.