AI平台开发运维工程师

职位描述:

1、负责AI服务全生命周期的治理工作,制定AI服务重保方案及部署规范(日志/监控/故障处理/SLA);

2、参与基础平台多种异构算力加入,涵盖硬件选型、性能压测、云商能力评估等。

3、参与建设AI平台核心能力,包括日志/监控/镜像分发/服务网格等系统,保障重点业务SLA(如游戏AI玩法上线)以及基础算力管理与调度优化。

4、支撑AIGC、游戏AI等核心业务的高效稳定运行。

职位要求:

1、3年以上游戏AI业务管理经验,熟悉K8S生态及云原生技术栈(服务网格/监控/日志系统)。

2、具备复杂业务迁移能力(如机房搬迁),擅长跨团队协作,熟悉主流公有云服务。

3、熟悉AI服务在游戏场景下的部署调优者优先。

4、熟悉分布式存储(CubeFS)、以及大规模数据处理经验者优先。

5、具备GPU资源管理经验优先。

公司地点:广州天河区广建2栋

公司简介:

网易 (NASDAQ: NTES)是中国领先的互联网技术公司,在开发互联网应用、服务及其它技术方面,始终保持国内业界的领先地位。网易对中国互联网的发展具有强烈的使命感,网易利用最先进的互联网技术,加强人与人之间信息的交流和共享,实现“网聚人的力量”。

职位发布者:宋先生

网易(杭州)网络有限公司

融资阶段:已上市

公司规模:1000~9999人

相似职位: