职位描述:
1.性能分析与优化:深入分析和优化GPU应用程序,识别并消除性能瓶颈,包括内存访问模式、线程调度和执行效率。
2.算法开发:利用CUDA并行计算框架,开发和实现高效的GPU加速算法,提升计算密集型任务的处理速度。
3.向团队提供技术指导和培训,分享GPU编程的最佳实践和优化技巧。
4.持续关注GPU技术和行业趋势,评估并整合新技术以提升系统性能。
职位要求:
1. 计算机科学、电子工程或相关领域的学士或硕士学位及以上。
2.至少5年的GPU编程和性能优化经验,具有丰富的CUDA开发背景。
3.精通C/C++编程,具备深入的计算机体系结构和并行计算原理知识。
4.熟练使用GPU性能分析和调试工具(Nsight Compute/Systems)等,具有实际的性能优化案例和成果。
5.有使用Orin或Xavier平台进行AI模型部署和优化,以及开发自动驾驶相关算法的实战经验优先。
6.具备推理引擎优化经验(TensorRT/TVM优化、INT8量化算子实现)优先。