岗位职责:
1、负责公司高并发云平台的架构规划、部署与优化,保障系统的高可用与稳定性;
2、主导基于Docker/Kubernetes 的容器平台设计、部署及运维;
3、建设完整的监控体系与应急响应机制,及时发现并解决系统性能瓶颈和疑难故障;
4、制定并持续优化运维策略,包括容灾备份、负载均衡、弹性扩容、安全防护等;
5、管理日常运维成本与资源预算,实现资源使用效率最大化。
任职要求:
1、本科及以上学历,计算机相关专业,8年以上相关经验,3年以上团队管理经验;
2、精通Linux系统操作与内核机制,具备系统调优与故障排查能力;
3、熟悉云平台(多地跨数据中心/多可用区/多云架构)架构的监控体系构建,掌握跨地域数据聚合与告警收敛方案;
4、精通主流中间件与数据库(Nginx、Redis、MySQL、MongoDB、ElasticSearch、Kafka 等)部署优化;
5、熟练使用 Grafana、Prometheus 等监控/可观测性工具,具备数据可视化及故障根因分析能力;
6、掌握 Kubernetes、Service Mesh 等云原生架构及其运维实践;
7、擅长撰写技术文档,具备推动监控规范、技术选型、故障复盘等能力;
8、有 DevOps 经验及 CI/CD 构建能力者优先。