岗位职责:
1、系统架构与维护: 负责公司线上生产环境的部署、监控、容量规划、调优与高可用保障,确保服务的稳定性、安全性与可扩展性。
2、中间件与数据库运维:
负责 Nginx 负载均衡、反向代理配置、性能优化与安全加固。
负责 MySQL 数据库的日常运维,包括部署、主从复制、备份恢复、性能监控与SQL调优。
负责 Redis 集群的部署、监控、容量规划、数据持久化与高可用方案(哨兵/集群模式)的实施。
3、容器化与编排:
基于 Kubernetes (k8s) 进行容器化部署与管理,负责k8s集群的搭建、运维、扩缩容、故障排查和性能优化。
设计和维护CI/CD流水线,实现应用的自动化构建、测试、部署和发布。
监控与应急响应: 完善监控告警体系(如Prometheus+Grafana、云监控),快速响应并处理系统故障,对线上事故进行复盘总结。
自动化与DevOps: 编写自动化脚本(Shell/Python/Ansible等),自动化日常运维操作,提升运维效率,推动基础设施即代码(IaC)实践。
4、安全与成本优化: 实施系统安全策略,定期进行安全扫描和漏洞修复。监控云资源使用情况,进行成本分析与优化。
岗位要求:
1.计算机相关专业全日制统招本科学历,3年以上Linux系统运维经验。
2.精通Nginx 配置、优化及高并发场景下的问题处理。
3.熟练掌握Kubernetes 核心概念和工作原理,有实际的k8s集群管理和应用部署经验。熟练掌握MySQL 数据库,精通SQL语句优化、索引优化、慢查询分析及主从复制、备份恢复等技术。熟练掌握Redis,理解其多数据结构、持久化机制,有高可用集群(哨兵/Cluster)的运维经验。
4.熟练使用至少一种脚本语言(Shell/Python/Go等)进行自动化运维开发。熟悉常用的监控工具(如Prometheus、Grafana等),具备强大的日志分析及故障排查能力。
5.具备良好的团队协作精神、责任心和抗压能力,对系统稳定性和安全性有极致追求。
优先考虑:
熟悉阿里云产品者优先,并有相关云上运维实践经验。
有大规模、高并发系统运维经验者优先。
熟悉CI/CD工具链(如Jenkins、GitLab CI)者优先。
持有阿里云ACP/ACE、CKA等相关认证者优先。
入职即缴纳五险一金;各类补贴、工会福利等