岗位职责
1、通过研发自动化、智能化、数据化的工具和系统平台提升团队的整体工作效率,避免低效重复劳动,降低运维成本;
2、参与容器集群管理平台建设,包括但不限于资源管理、故障诊断处理、成本优化和性能治理等;
3、参与规模化运维工具建设,包括但不限于资源调配迁移规划工具、迁移执行工具、重启工具等;
4、参与系统可观测性系统建设,包括但不限于监控大盘、日志采集体系、告警体系设计等;
5、参与资源供给、成本优化相关工作,通过故障诊断修复、事故运营、容量管理、成本治理等方向提升容器平台服务质量;
6、探索业界运维新技术,结合公司实际优化流程制度和技术方案,改进产品功能,提升运营效率。
任职要求
1、深入理解Linux系统,精通TCP/IP、HTTP等协议,具备扎实的网络、计算机体系结构方面的知识;
2、具备常用组件(包括单不限于 Redis/MySQL/Kafka/Nginx/Nacos)的使用和运维经验;
3、至少熟悉一门编程语言,java/python/go,能开发工具提升效率;
4、熟练掌握Docker容器技术及K8S容器编排,对弹性扩缩容有深刻理解;
5、熟练使用一款公有云平台;
6、优秀的自我驱动力,良好的项目执行力;
7、具备很强的问题分析和推进解决的能力;
8、工作细致、勤于思考、善于团队协作。
具备以下者优先
1、 有超大规模集群管理经验者优先;
2、 对开源组件有二次开发经验者优先;
3、 熟悉微服务、Mesh、Serverless、云原生、混沌工程技术者优先。