职位描述
1、跟踪和研究面向大规模 GPU 集群的分布式系统优化技术和 RDMA 网络通信技术
2、配置和调优 GPU-RDMA 网络协议与算法以及 GPU 高速网络通信库
3、负责大规模集群系统包括计算、存储、管理等网络的状态监控、配置校验和故障定位
4、负责 K8S CNI 网络虚拟化产品的研发,具体包括 Kube-ovn、Kube-vip、Cilium 等
职位要求
1、本科或本科以上学历,3-5年以上相关工作经验,计算机、通信等相关专业
2、扎实的编程能力,熟练掌握至少一种编程语言,如 C、C++、Golang等
3、具备网络虚拟化层面的相关技术栈,如 overlay、ovs-ovn、sriov 等
4、熟悉集合通信、拥塞控制、流量调度、路由查找、网络校验、拓扑设计等
5、熟悉 Linux 内核协议栈、DPDK、RoCEv2、NCCL、MPI、UCX等底层驱动和通信接口
北京海淀或者上海徐汇