HyCAN集合通信 开发工程师(上海)

可base南京、上海、成都、深圳、西安

岗位职责:

1. 负责自研NPU芯片平台设计并实现高性能集合通信库,支持 AllReduce、AllGather、Broadcast 等通信原语

2. 负责研发集合通信核心算法(环形、树形、多级归约等),确保通信操作在不同拓扑下的高效可扩展性

3. 负责集成 InfiniBand、RoCE 等 RDMA 技术,实现零拷贝、低延迟的数据传输

4. 负责NPU集群拓扑管理和集群维护通信框架开发

任职要求:

1. 计算机、电子信息、通信工程或相关专业本科及以上学历,3 年及以上分布式通信或 HPC 开发经验

2. 精通 C/C++ 编程,熟悉面向对象设计与多线程并发模型

3. 熟悉 MPI、OpenMPI、NCCL、UCX/UCC 等主流集合通信库及其源码实现原理

4. 具备性能分析与调优能力,熟悉 perf、nvprof等工具

公司地点:上海浦东新区张江人工智能岛-21栋301室

公司简介:

职位发布者:邹经理

深圳云天励飞技术股份有限公司

融资阶段:

公司规模:

相似职位: