Мы в поиске Специалиста на проект по исследованию в области ИИ (оптимизация моделей глубокого обучения на edge-платформах).
Задача: участие в разработке техники сжатия моделей и квантования для повышения производительности AI-задач на устройствах с ограниченными ресурсами.
Обязанности
-
Исследовать и внедрять QAT/PTQ, эффективные алгоритмы инференса с фокусом на латентность, память и энергопотребление.
-
Работать с PyTorch, ONNX Runtime, TVM для развертывания моделей.
-
Сотрудничать с hardware-инженерами edge NPU.
-
Исследовать производительность и отслеживать тренды в AI efficiency и acceleration.
Требования
-
Знания и опыт в машинном обучении, оптимизации.
-
Опыт QAT/PTQ, mixed precision; Python/C++/CUDA/OpenCL; фреймворки (PyTorch/TensorFlow/ONNX/TVM/TensorRT).
-
Знание аппаратных ускорителей (SIMD/AVX/Tensor Cores) и компиляторных оптимизаций (XLA/MLIR/LLVM).
Умение общаться на английском обязательно.