岗位职责:
1、完成从网络设备选型、网络规划和设计、网络部署、网络安全评估到系统交付的建设全过程。
2、负责GPU集群的总体规划与建设,负责AI服务器、网络技术解决方案技术支持。
3、负责智能算力基础设施层的网络规划、GPU/DPU等异构计算网络架构设计、智能算力网络整体方案交付。
4、负责智算及云计算项目的售后技术支持,智算平台计算/存储/网络架构设计和解决方案编写。
5、公司交办的其他任务等。
任职要求:
1、计算机网络或相关专业;全日制本科及以上学历,具备三年以上网络规划和运维经验。
2、精通TCP/IP、VRRP、OSPF、BGP、VPN、负载均衡等技术原理。
3、熟悉主流防火墙、安全网关的安装、配置和故障排查。
4、熟悉AI网络库NCCL,熟悉IB、RoCE网络,有NVIDIA等GPU集群部署、调度、管理、优化经验优先:实施过GPU/DPU集群的网络规划,大规模部署、性能调优和整体交付,熟悉IB组网,组织裸机和虚机等方式的GPU资源和服务经验者优先。
5、有HCIE,CCIE,H3CIE/TE等相关证书优先考虑。
6、具备一定自动化脚本能力优先考虑(例如BASH,Python)。
7、熟悉开源交换机操作系统优先(cumulus、sonic等)
8、优秀的口头和书面沟通技巧,出色的人际交往能力。
9、富有事业心和团队合作精神,有很强的技术沟通能力和技术文档编辑能力。