岗位职责:
1、负责软硬件以及服务器设备的巡检工作,并定期做巡检报告,以及对服务器系统进行保障和维护;
2、根据业务需求,规划、设计服务器架构方案,搭建具备高性能、高可靠性、易伸缩、可扩展、安全的运营平台;
3、云服务、网络、CDN和基础服务的建设(LVS、FTP、HTTP、DNS);负责资产管理,服务器选型、交付和维护;
4、线上服务的变更、服务状态监控、服务容灾和数据备份等工作,对服务进行例行排查、故障应急处理等工作。运维技能需求;
5、负责公司微服务集群相关组件的日常维护、监控、异常处理等工作,保障集群&相关组件稳定运行;
6、根据已有的运维手册执行相关的运维工作,在工作过程中根据新出现问题完善手册和运行流程;
7、配合需求部门执行集群各组件的升级等任务;
8、配合其它组探索、研究新的运维技术方向、完善平台运维工具和手段;
运维小组根据人员排班完成集群的7*24小时的运维工作(含部分Helpdesk工作)。
任职要求:
1、 具备一定硬件维护以及排障能力;
2、熟悉TCP/IP协议,HTTP协议、服务器和网络设备的主要参数和性能指标;
3、掌握网络设备,防火墙、交换机,路由器,排查网络、服务器故障,能处理iptables、DNS、路由等问题;
4、掌握Sentinel/Ribbon/Nginx/Keepalive/LVS/HAProxy等负载均衡技术;
5、掌握常用服务的安装及配置如k8s/Docker/DLK/Nginx//Sping-Cloud组件等安装、监控、排错、运维;
6、掌握Oracle/MySQL/mongodb/Memcached/Redis等软件系统的安装、监控、排错、运维和调优能力;
7、掌握ELK日志监控管理平台的部署使用;
8、掌握VPN软件使用管理;
9、精通Linux及各类操作系统、数据库、应用服务、虚拟化服务;
10、精通Nagios,Cacti,Zabbix等监控维护技术,熟练使用Shell/Perl/Python脚本处理问题;
11、熟悉主流云计算平台,如腾讯云服务器的部署、运维;
12、有较强的沟通及协调能力,学习能力强,做事沉稳细致、具有良好文档编写和文字表达能力。