岗位职责
1、负责GPU加速应用的开发、优化与维护,针对深度学习进行高性能算法设计与实现。
2、分析CUDA代码的性能瓶颈,提出并实施优化方案。
3、与算法工程师、硬件团队协作,确保GPU资源的高效利用,最大化算力性能。
4、编写高性能计算相关技术文档,主导代码审查与性能调优最佳实践的分享。
任职要求
1、计算机科学、电子工程、数学或相关领域本科及以上学历。
2、5年以上开发经验,3年以上CUDA开发经验,深入理解NVIDIA GPU架构(如Ampere/Ada Lovelace/Hopper)及CUDA编程模型。
3、掌握GPU并行编程关键技术,熟悉常见优化手段。
4、熟悉深度学习框架(TensorRT、PyTorch CUDA扩展)或高性能计算库(cuBLAS/cuDNN/cuFFT)。