AI集群性能优化工程师/专家(网络)

岗位职责:

1. 负责AI研发平台中网络通信性能的优化,包括分布式训练数据传输的优化和通信效率的提升。

2. 研究和优化高效通信库(如NCCL、MPI、HCCL)的性能,以提高分布式计算和训练的速度。

3. 优化和改进通用通信框架(如UCX)的性能,确保其在多种底层网络协议下的高效运行。

4. 设计和实现高效的数据汇总与分发机制,提升跨GPU节点的数据同步和共享效率。

5.协调内部研发团队,确保网络性能优化需求的准确定义和高质量交付。

6.阅读行业前沿论文,并进行市场调研和行业趋势分析,提出网络性能优化的改进方案。

7. 编写技术文档,组织内部技术分享,确保知识传递和团队技能提升。

招聘要求:

1. 计算机科学、网络工程、信息技术或相关专业硕士及以上学历,博士优先。

2. 至少5年网络性能优化相关经验,具备分布式系统、GPU通信等领域的深厚知识。

3. 熟悉高效通信库(如NCCL、MPI、HCCL)和通用通信框架(如UCX),有相关优化经验。

4. 具备优秀的项目管理能力和跨团队协调能力。

5. 出色的沟通和领导能力,能够有效推动团队协作和项目进展。

公司地点:上海闵行区虹桥绿谷广场F1座4F

公司简介:

比亚迪集团成立于1995年2月,经过20多年的高速发展,已在全球设立30多个工业园,实现全球六大洲的战略布局。比亚迪业务布局涵盖电子、汽车、新能源和轨道交通等领域,并在这些领域发挥着举足轻重的作用,从能源的获取、存储,再到应用,全方位构建零排放的新能源整体解决方案, 比亚迪是香港和深圳上市公司,营业额和总市值均超过千亿元。

比亚迪坚持自主创新,掌握电池、电机、电控及芯片等电动车全产业链核心技术,在2008年推出全球首款量产插电式双模电动车,在2010年提出全球首个公共交通电动化解决方案,之后上升为国家战略,形成全球共识,持续引领行业变革。截至2020年底,比亚迪电动车销量连续8年中国第一,已驶入全球50多个国家和地区、300多个城市,是首个进入欧、美、日等发达市场的中国汽车品牌。

职位发布者:董先生

比亚迪汽车工业有限公司

融资阶段:已上市

公司规模:10000人以上

相似职位: