中间件运维工程师

岗位职责

1.系统运维与优化,负责Kafka、Redis、ZooKeeper(ZK)等中间件集群的部署、监控、调优、故障排查及日常维护,保障系统高可用性、高性能和安全性。

2.设计并实施中间件的高可用架构(如Kafka多副本机制、Redis Cluster、ZK集群部署),分析中间件性能瓶颈(如Kafka吞吐量、Redis内存/延迟、ZK选举性能),制定优化方案。

3.故障响应与容灾,7x24小时响应中间件相关的生产环境故障,主导根因分析(RCA)、恢复及改进措施落地。

4.设计容灾方案,定期演练备份恢复、集群扩缩容、数据迁移等场景。

5.自动化与工具建设,开发运维脚本或工具(如Ansible/Python),实现自动化部署、监控告警、日志分析等。

6.建设中间件运维体系,完善监控指标(Prometheus/Grafana)、日志收集(ELK)和告警策略。

7.新技术探索,跟踪中间件领域技术动态(如Kafka Tiered Storage、Redis Streams),评估并引入适用于业务的解决方案。

任职要求

1.精通Kafka核心原理(ISR机制、Controller选举、日志存储)、Redis数据类型/持久化/集群模式、ZooKeeper ZAB协议及典型应用场景(分布式锁、配置中心)。

2.熟悉Linux系统运维,掌握JVM调优、网络协议(TCP/IP)、IO模型及性能分析工具(如Arthas、perf)。

3.熟练使用Shell/Python/Go等语言编写运维脚本,具备Ansible/Terraform等自动化工具经验。

4.3年以上中间件运维经验,主导过大规模(如千级节点)Kafka/Redis/ZK集群的运维或升级改造。

5.至少参与过一次从零构建中间件运维体系的完整过程。

公司地点:杭州滨江区杭州萤石总部园区188

公司简介:

职位发布者:金先生

杭州萤石网络股份有限公司

融资阶段:

公司规模:500~999人

相似职位: