此岗位for子公司扁鹊健康
岗位职责:
1、系统运维与架构保障负责Linux生产环境
(CentOS/Ubuntu等)的部署、监控、调优及故障排查 ,处理线上紧急事故,主导故障复盘并输出SOP文档
2、自动化开发与工具链建设开发运维工具(如日志分析、自动化巡检等),提升运维效率编写生产级 Shell脚本(需符合错误处理、日志记录、并发控制等规范)
3、中间件与数据库治理Zookeeper/Cassandra/ Aerospike/Kafka/Redis/ES等中间件的集群部署、性能调优及故障处理MySQL/Oracle的SQL优化、慢查询分析、备份恢复方案设计建设和维护统一的监控告警体系(Prometheus+Alertmanager+Grafana)
核心技术要求:
1、Linux与脚本能力(硬性要求)精通Linux系统管理(进程/网络/存储)、内核参数调优熟练编写健壮性Shell脚本(需熟悉awk/sed高级文本处理)
2、中间件与数据库熟悉Zookeeper、Kafka集群管理、Redis持久化策略、ES索引管理和优化具备SQL优化能力,能分析执行计划并解决死锁问题
3、开发能力 有Java应用排障经验(如OOM、线程池堵塞、GC日志分析)理解微服务架构,能协助开发团队排查接口级问题
4、云原生技术栈
精通Kubernetes集群的部署、运维、故障排查及性能调优;
深入掌握Docker容器化技术及编排工具链(Helm/Operator/CRD);
具备K8S生态组件实战经验:
服务网格(如Istio/Linkerd)、
持久化存储方案(CSI/StorageClass设计)、
网络策略(Calico/Cilium)、
自动扩缩容(HPA/VPA)等;
有云服务(AWS/Aliyun)Kubernetes托管服务(EKS/ACK)的实战经验,熟悉云上网络、存储、安全组件的集成。
5.对问题有清晰的分析逻辑和全局思维,能提出具有创造性的解决思路和方案,并有良好的沟通能力和结构化表达能力,以及团队合作意识;
6.全日制本科(学信网可查)及以上学历
加分项:
有大规模K8S集群(100+节点)管理经验;
参与过云原生可观测性体系建设(Logging/Tracing/Metrics联动)