主要工作内容描述:
负责NPU SDK开发集成&工具链自动化调优&负责联合IP 供应商开展模型精度验证及场景验证
岗位职责:
1.负责设计、开发和维护DSA架构下的NPU编译器工具链,确保其高效稳定运行。
2.扩展和优化深度学习框架(包括TensorFlow、PyTorch、ONNX等)的支持能力,提升AI模型兼容性。
3.负责计算图优化,包括各种网络的常见通用优化以及针对硬件平台的优化。
4.优化编译器工具链中的各种算法,以提高编译质量和执行效率。
5.与芯片设计团队及软件开发团队紧密合作,进行系统层面的编译器性能调优。
6.对开源编译器框架TVM/LLVM(MLIR)进行二次开发,以满足自驾业务需求。
任职要求:
1.计算机科学、电子信息工程或相关专业硕士学位以上,3年以上相关工作经验。
2.精通C/C++和Python等程序设计语言,具备扎实的编码能力。
3.熟悉TensorFlow、PyTorch、ONNX等深度学习框架的使用和内部机制。
4.深入理解编译器架构和原理,具备编译器或嵌入式系统开发经验。
5.拥有GPU、NPU、DSP等异构计算平台的开发和性能优化经验。
6.熟悉自驾场景者优先。