工作职责:
1. 负责对公司业务的日常运维,包括多环境部署、上线、监控、故障应急处理等
2. 负责产品的业务监控,容量规划,性能调优等
3. 掌握基于K8S等使用范式,管理多集群的实战经验,开发和维护自动化平台
4. 负责云产品稳定性治理,保障业务高度稳定性
5. 负责云产品容灾架构的设计和落地
任职资格:
1. 3年以上公有云产品运维经验,对计算、网络、数据库等有深入的理解
2. 熟练掌握Docker、Kubernetes等云原生技术,有大规模集群管理经验者优先
3. 熟悉linux操作系统,具有较强的问题定位能力,熟练掌握Go、Python至少一种开发语言
4. 对云原生可观测架构有深入实践,具有Prometheus/Grafana/OpenTelemetry等应用经验者优先
5. 对稳定性保障和丰富的实战经验,如高并发流量的处理,异常流量的定位治理;深入业务架构,对于复杂业务的优化改进、系统的高可用性架构实现,业务生命周期稳定性治理有深入的理解
6. 有较好的沟通能力,善于主动思考,执行力强,对于新技术有强烈兴趣;对接业务需求,与开发、产品团队协作,深入业务支持
7. 有海外云产品运维经验者优先,掌握异地容灾,异地多活等容灾架构,对海外网络加速有深入的理解
8. 了解AIOps,有数据分析和系统优化经验者优先