职位描述
1、负责自动驾驶&机器人端侧的深度学习算法部署与以及相关的优化工作;
2、负责核心算法从预处理,模型算子优化到硬件加速上线的全流程建设。
职位要求
1、熟悉linux,熟悉C++,具有良好的编程风格,对端侧加速优化有非常强烈的兴趣;
2、扎实的计算机底层基础,熟悉优化,性能调优的常见方法;
3、熟悉arm-neon或者CUDA,有过blas优化经验者更佳;
4、熟悉TensorRT,TVM,NCNN,SNPE等加速框架,有过对应算子编写和优化经验的更佳;
5、有Transformer相关优化经验者更佳。