岗位职责
1. 负责智能驾驶模型在多种不同硬件平台的极致性能优化,结合编译优化、并行计算优化、图融合、高效 CUDA 算子开发实现行业领先的车端推理性能。
2. 针对特定NPU硬件计算平台,基于对硬件体系结构的深入理解,实现对硬件的高效利用。
3. 针对Pytorch/CUDA相关GPU计算任务,进行算子和系统优化,提升训练/推理效率。
岗位要求
1. 工作5年以上,计算机/数学/物理/电子工程/自动控制专业本科及以上学历优先。
2. 优秀的代码能力,熟练掌握C/C++或Python,有 CUDA 开发经验,熟悉TVM/TensorRT/Triton/Cutlass等推理框架优先。
3. 熟悉计算机体系结构,对GPU、NPU等有比较深刻的理解。
4. 熟悉CNN/Transformers/DETR等主流模型原理。
5. 良好的团队协作能力;创新性强,有良好的动手实现能力,对技术有热情。
Momenta 是全球领先的自动驾驶公司,致力于通过突破性的AI科技,创造更美好的生活。为实现可规模化的自动驾驶,Momenta基于数据驱动的“飞轮”技术洞察,以及量产自动驾驶(Mpilot)与完全无人驾驶(MSD)相结合的“两条腿”产品战略,提供不同级别的自动驾驶解决方案,更高效快速地实现无人驾驶规模化落地,赋能更安全、便捷、高效的未来智慧出行。
Momenta成立于2016年,在中国、德国、日本有全球业务,并已获得上汽集团、通用汽车、梅赛德斯-奔驰、丰田和博世的战略投资。