岗位职责
1、统筹IAAS/PAAS资源管理和运维(服务器/云主机/智能终端/盒子),理解资源和业务,通过网络分析,匹配业务调整等手段优化利用率与成本;
2、负责按照 “故障预防、故障发现、故障定位、故障恢复、故障改进” 这一核心思路,构建运维的服务稳定性保障体系;
3、负责监控响应,解决日常运营中遇到的各种问题;
4、协同产品、研发、采购等部门,保障资源与业务需求动态匹配,共同达成设定目标;
5、定期监测资源风险,及时落实和推进风险应对措施;
6、有机会参与到搭建/优化运营管理平台和工具链,设计资源监控与弹性扩缩容体系,提高大规模资源运营效率;
7、有机会参与到自动化运维平台、智能客服等规划设计、实现及优化工作,提升运维工作效率;
任职要求
1、熟悉Linux操作系统和网络原理,及运维工具(Prometheus、Zabbix等);
2、掌握自动化运维工具链(Ansible、Terraform、Jenkins),了解容器化技术(Docker/K8s)者优先
3、熟练使用SQL、Python、ELK、Grafana者优先
4、具备良好的沟通表达能力及团队协作精神、有较强的主动性、责任心与执行能力;
5、计算机科学、信息技术、软件工程等相关专业本科及以上学历者优先