岗位职责
1.负责集团大规模elasticsearch集群的全面运维和优化工作,保证ES集群稳定和高可靠性。
2.负责多套大数据集群和运维和监控,保障集群和数据业务高可用;
3.负责基于大数据和ES的监控预警,及时进行故障恢复;
任职要求
1.精通elasticsearch,对大规模ES集群运维有丰富的运维经验,包括集群的搭建部署、数据安全、扩缩容、审计日志、生命周期、备份回档、性能调优(查询,索引,IO,负载等)及资源管理,监控,确保业务稳定高效运行。
2、熟练掌握JAVA/Python/Go语言中的一种,熟悉hadoop各生态组件、具有hadoop平台应用及管理运维经验、 熟悉大数据平台和底座,如dataworks,EMR,CDP,NDH等。
3. 熟悉大数据相关原理,对hiveSQL有一定优化经验
4. 熟悉数据湖相关组件(如iceberg,paimon等),并有相关运维经验。
5. 熟悉监控预警系统,熟悉prometheus、 grafana、zabbix等开源监控工具,能完成对大数据集群和es集群各维度的监控预警。