职位描述:
1、负责平台的技术运维工作,保障服务处于高可用的水平,包括日常的部署、升级、扩容、缩容、告警处理、故障解决、容灾演练等;
2、负责研发过程工具链的建设,包括不限于:流程梳理,CICD,发布管理,持续改进等,提升整体研发效能;
3、负责跟进业务从接入到上线全过程的运维技术解决方案;
4、解决业务上线过程及长期运营中,遇到的技术问题,发现运营风险及技术难点,优化业务流程,优化项目架构,提升运维工作效率和服务质量;
5、与各技术组建立良好的合作沟通与信任关系,对业务存在的风险问题进行定期反馈和改善跟进,保障业务稳定运行。
任职要求:
1、5年以上工作经验,熟悉Linux操作系统运维,具有快速定位问题和问题解决能力;
2、精通掌握Shell,熟悉Python或者Go语言者优先;
3、熟练掌握Zabbix,Prometheus,Grafana等监控工具;
4、熟悉容器技术,有良好的Kubernetes技术能力,熟悉常用弹性、调度、发布、运维等周边项目;
5、熟练配置主流中间件,包括但不限于Kafka,Es,Etcd,Zookeeper等;
6、熟练掌握CICD中需要用到的开源工具如Jekins,Ansible,gitlab等工具的运用,擅长通过工具解决日常繁琐重复的工作,拒绝低效工作;
7、练掌握Nodejs,Java,Php,Python等项目的运维技术;
8、具备较强Ownership、逻辑思维能力、学习创新能力、文档整理能力,以及良好的沟通技巧和团队合作能力,性格开朗有较强抗压能力。