【工作职责和内容】 1. 容器平台运维: ◆ 设计、搭建和维护高可用的容器平台基础设施,确保平台稳定性和可靠性。 ◆ 管理Kubernetes集群,包括版本升级、故障排查和性能优化。 2. 自动化工具开发: ◆ 领导团队开发、维护和优化自动化工具,促进各项运维任务的自动化执行。 ◆ 设计和实施弹性伸缩、自愈和灾备恢复工具,提高系统的自动化治理水平。 3. 监控和告警: ◆ 设计并实施系统监控、告警和日志分析系统,确保对系统状态有全面的实时了解,对故障快速响应。 4. 安全和合规性: ◆ 负责容器平台的安全管理和合规性,确保符合公司的安全标准和政策。 5. 团队领导: ◆ 领导容器平台团队,帮助团队成员提升技能,制定运维策略和规划未来发展方向。 【任职资格】 5年以上的云计算、容器化和自动化运维经验,有以下相关工作经验更佳: ◆ Kubernetes集群管理经验 ◆ 熟悉Kubernetes的系统架构和编程范式,有Operator扩展或相关产品研发经验优先; ◆ 对Linux系统有深入的理解,熟悉docker及相关的网络和存储技术,有生产环境下的开发运维经验优先 ◆ 出色的团队领导能力和沟通能力,具备卓越的问题解决和决策能力 ◆ 深入理解云原生技术栈,熟悉两个或以上技术域:K8S资源调度、ServiceMesh、多运行时、Serverless 、容器运行时、离在线混部、容器网络SDN 、深度可观测性; ◆ 待人真诚、乐于协作、有责任心、有创新精神。
深圳上步工业区
容器平台系统可靠性(SRE)技术专家深圳NaN运维经理/主管40-70k15薪
上海尔儒企业管理咨询有限公司