职位描述:
1. 负责IDC机房日常运维及管理工作,制定数据中心服务策略
2. 负责响应IDC事件及应急故障处理,实现IDC变更、故障等运行风险可控
3. 负责机房物理安全体系的搭建与落地,包括但不限于门禁管理、视频监控、消防系统运维、环境(温湿度、电力稳定性)监控等,确保机房物理环境符合安全规范
4. 负责数据中心建设跟进,确保机房建设按计划进行,并根据专业经验给出建设建议并落地
5. 负责IDC资源相关需求受理及交付,负责各业务中短期和特殊IDC资源需求的接收、分析、规划匹配、建设、交付跟进;
6. 负责落地设备上架交付,包含机柜规划、综合布线、验收等
7. 设计并落地设备交付配套资源预警机制,对设备交付配套资源,如模块,线缆等规划预警,提前识别资源瓶颈,保障业务交付的连续性。
8. 外包SOP、外包管理框架等文档的编写和发布;
9. 负责对现场外包的服务质量和效率进行监控,发现问题并及时对现有流程和规范进行优化;
10. 负责IDC本地运营团队人才梯队建设、能力培养,现场运维外包团队管理及考核。
职位要求:
1. 熟练使用Linux系统,具备shell/Python等脚本语言能力;
2. 熟悉X86服务器硬件组件/子系统CPU,Disk,Memory,PSU等验证方案者优先;
3. 具有较强的分析问题解决问题的能力,和良好的团队沟通协作能力;
4. 熟悉自动化运维技术,能充分利用自动化运维来提高工作效率;
5. 熟悉各类GPU机型者优先;
5. 学习能力强,技术兴趣广泛;责任心强,对工作充满热情,有较强的文档总结能力。
6. 8年以上IDC管理交付经验,1年以上智算中心交付经验