职位描述:
1、负责AI服务全生命周期的治理工作,制定AI服务重保方案及部署规范(日志/监控/故障处理/SLA);
2、参与基础平台多种异构算力加入,涵盖硬件选型、性能压测、云商能力评估等。
3、参与建设AI平台核心能力,包括日志/监控/镜像分发/服务网格等系统,保障重点业务SLA(如游戏AI玩法上线)以及基础算力管理与调度优化。
4、支撑AIGC、游戏AI等核心业务的高效稳定运行。
职位要求:
1、3年以上游戏AI业务管理经验,熟悉K8S生态及云原生技术栈(服务网格/监控/日志系统)。
2、具备复杂业务迁移能力(如机房搬迁),擅长跨团队协作,熟悉主流公有云服务。
3、熟悉AI服务在游戏场景下的部署调优者优先。
4、熟悉分布式存储(CubeFS)、以及大规模数据处理经验者优先。
5、具备GPU资源管理经验优先。
网易 (NASDAQ: NTES)是中国领先的互联网技术公司,在开发互联网应用、服务及其它技术方面,始终保持国内业界的领先地位。网易对中国互联网的发展具有强烈的使命感,网易利用最先进的互联网技术,加强人与人之间信息的交流和共享,实现“网聚人的力量”。