GPGPU架构师(A83489)

职位描述:

1.架构设计与优化

负责设计和优化GPGPU架构,以满足高性能计算需求。

深入理解GPGPU的硬件特性,包括多处理器、线程块、共享内存等,以实现高效的并行计算。

评估和改进GPGPU架构的性能,包括内存带宽利用、计算资源分配和线程调度。

2.CUDA编程与部署

熟悉CUDA C/C++等语言进行高性能计算程序的开发。

熟悉编写和优化CUDA内核, GPU上高效运行。

熟悉深度学习CUDA部署。

熟悉分布式计算框架。

3.性能优化与调试

通过分析工具和性能指标,识别和解决性能瓶颈。

运用CUDA提供的原子操作、同步机制等特性,优化多线程程序。

调试和优化CUDA程序,确保其在不同硬件配置下稳定运行。

4.技术研究与创新

跟踪CUDA和GPGPU架构的最新技术发展趋势。

探索新的并行计算模型和算法,提升计算效率。

与团队合作,推动技术创新和架构改进。

5.团队协作与支持

与软件工程师、硬件工程师紧密合作,确保架构设计满足项目需求。

提供技术指导和培训,帮助团队成员提升CUDA编程和GPGPU架构设计能力。

职位要求:

1.教育背景:计算机科学、电子工程或相关领域的本科及以上学历。

2.专业技能

精通CUDA编程模型,包括线程层次结构、内存管理、同步机制等。

熟悉GPGPU架构,了解其硬件设计和性能特点。

具备并行计算的实践经验。

熟练使用CUDA开发工具,如NVIDIA Nsight、CUDA-GDB等。

3.工作经验

至少5年以上的CUDA开发经验。

有高性能计算项目或大规模并行计算系统的开发经验。

4.其他要求

良好的问题解决能力和团队合作精神。

能够在快节奏的环境中工作,具备较强的学习能力和适应能力。

加分项

有深度学习、计算机视觉或科学计算领域的经验。

在GPGPU架构设计或优化方面有研究成果。

公司地点:上海浦东新区张江科学之门T5(模力·界)~

公司简介:

小鹏汽车致力于通过探索科技,引领未来出行变革,做“未来出行探索者”。公司总部位于广州,在北京、上海、深圳、肇庆、扬州等地设有研发中心,并在肇庆布局智能制造基地。同时,小鹏汽车面向全球进行研发和销售布局,已在美国设立研发中心、在欧洲多地设立分公司。小鹏汽车坚持全栈自主研发智能辅助驾驶软件和开发核心硬件,为用户带来卓越的智能驾乘体验。2020年8月27日,小鹏汽车正式登陆纽交所,募资规模打破当时全球新能源汽车行业IPO纪录,股票代码为“NYSE:XPEV”;2021年7月7日,小鹏汽车挂牌香港联交所,股票代码“9868.HK”,成为首个在中国香港和美国纽约两地双重主要上市的中国造车新势力。欲了解更多信息,请访问https://xiaopeng.com/。

职位发布者:熊经理

广州小鹏汽车科技有限公司

融资阶段:

公司规模:1000~9999人

相似职位: