工作内容:
1、通过体系化的监控、运维、容量管理、资源管理、拨测巡检、应急响应、事故管理等方式维护线上服务稳定性,保证服务SLO;
2、负责量化视频服务的服务质量和性能数据,提升服务 SLA 标准,规划预算,降低服务成本消耗。
职位要求
1、有大型系统的运维管理经验,2 年以上相关工作经验;
2、对系统有极强的责任心和敬畏心,热爱技术,具备强大的自驱力,主动学习,独立思考;
3、精通 Linux 系统、Shell / Python 编程语言、网络 TCP / IP 协议、数据库等,动手能力强;
4. 对大规模分布式系统的设计,分析,故障排查有强烈兴趣;
5、【加分项】有大型云计算公司从业经验,对于阿里云、AWS / GCP / Azure 系统开发、测试、运维、应用工作经验者优先。
6、【加分项】具备线上系统研发经验,理解线上稳定性工作的痛点、特点和重要性。