岗位职责:
1. 负责AI研发平台中网络通信性能的优化,包括分布式训练数据传输的优化和通信效率的提升。
2. 研究和优化高效通信库(如NCCL、MPI、HCCL)的性能,以提高分布式计算和训练的速度。
3. 优化和改进通用通信框架(如UCX)的性能,确保其在多种底层网络协议下的高效运行。
4. 设计和实现高效的数据汇总与分发机制,提升跨GPU节点的数据同步和共享效率。
5.协调内部研发团队,确保网络性能优化需求的准确定义和高质量交付。
6.阅读行业前沿论文,并进行市场调研和行业趋势分析,提出网络性能优化的改进方案。
7. 编写技术文档,组织内部技术分享,确保知识传递和团队技能提升。
招聘要求:
1. 计算机科学、网络工程、信息技术或相关专业硕士及以上学历,博士优先。
2. 至少5年网络性能优化相关经验,具备分布式系统、GPU通信等领域的深厚知识。
3. 熟悉高效通信库(如NCCL、MPI、HCCL)和通用通信框架(如UCX),有相关优化经验。
4. 具备优秀的项目管理能力和跨团队协调能力。
5. 出色的沟通和领导能力,能够有效推动团队协作和项目进展。
比亚迪集团成立于1995年2月,经过20多年的高速发展,已在全球设立30多个工业园,实现全球六大洲的战略布局。比亚迪业务布局涵盖电子、汽车、新能源和轨道交通等领域,并在这些领域发挥着举足轻重的作用,从能源的获取、存储,再到应用,全方位构建零排放的新能源整体解决方案, 比亚迪是香港和深圳上市公司,营业额和总市值均超过千亿元。
比亚迪坚持自主创新,掌握电池、电机、电控及芯片等电动车全产业链核心技术,在2008年推出全球首款量产插电式双模电动车,在2010年提出全球首个公共交通电动化解决方案,之后上升为国家战略,形成全球共识,持续引领行业变革。截至2020年底,比亚迪电动车销量连续8年中国第一,已驶入全球50多个国家和地区、300多个城市,是首个进入欧、美、日等发达市场的中国汽车品牌。