岗位职责:
1 负责K8S平台在运维工作中疑难问题的分析和解决,负责集群高可用优化的方案设计和灾难故障恢复的机制建立和演练。
2 参与项目架构设计、规划,执行部署实施以及管理;结合专业技术和领域知识,构建云原生运维体系。
3 参与对K8S集群周边生态的技术研究,能引进新技术在生产环境中最佳落地,提升K8S云平台的稳定性、安全性和易用性。
4 参与跨部门沟通,协调各产品线和IT项目方案在K8S环境中方案对接。
5 负责各类云原生组件和中间件集群风险识别,疑难杂症解决,通过定量分析,社区交流等方式识别集群风险并解决风险。
6 参与系统安全、性能压测等工作,根据运行监控情况,及时发现安全、性能隐患,并提出预防性及优化的建议。
7 具备较强的抗压能力。
岗位要求:
1 本科及以上学历,计算机相关专业,有3年以上云原生、SRE领域等实际工作经验。
2 深入了解K8S集群基础概念和原理,具备生产级容器系统管理经验;有istio等service mesh经验优先。
3 熟悉Linux/Unix/Windows 系统、网络、安全等相关知识。
4 熟练掌握Linux操作系统、Tomcat、springboot、Nginx,Kafka,Redis,Zookeeper,rabbitMQ、rocketMQ,Docker,K8s集群容器化等开源技术。
5 熟练使用基于云原生的Prometheus等监控工具对K8S集群进行监控和告警管理。
6 掌握bash/python/go任意一门语言,有运维开发经验优先。
7 具备良好的沟通能力和强烈的责任心,热爱运维技术,有良好的文字表达能力和自学能力,有良好的工作流程、文档制定撰写习惯和良好的团队合作意识。
8 具有较强的综合分析问题、抗压能力和解决问题的能力。