工作职责:
1、负责线上系统的稳定性运行、可靠性改进,包括但不限于监控告警及定位、中间件管理、系统性能管理和优化;
2、服务稳定性问题追查、定位和优化,追求极致的性能,提升系统稳定性;
3、持续的与开发团队,测试团队,产品团队等一起合作与沟通,不断的改善开发流程,提高发布质量,提高工作效率。
技能经验要求:
任职资格:
1、本科或以上学历,3年以上工作经验,有大型互联网公司运维工作经验者优先考虑;
2、精通Shell,熟练使用Python脚本语言;
3、熟悉K8s,Docker 虚拟化与容器原理及技术;
4、有基于K8S+微服务架构的自动化部署、运维和自动化监控经验,熟悉K8S系统架构的搭建与维护;
5、熟悉MySQL、Postgresql、Nginx、Redis、Zookeeper运维部署;
6、熟悉使用 Ansible 等自动化运维工具,有Jenkins/gitlab-ci等持续集成 持续交付工具优先;
7、熟悉使用公用云(华为云/阿里云)全线产品(包含不限于:ECS / RDS / SLB / OBS / 日志服务 等)运维