岗位职责:
1.负责公司标准软件的安装及故障处理,及时响应、定位、处理各类问题;
2.负责公司办公网络基本故障排查及处理,配合机房上下架服务器等网络基础工作;
3.主动发现业务系统的问题和隐患,及时对系统功能优化提出合理化建议;
4.能够运用主机监控、日志分析等工具进行复杂问题的定位;
5.负责总结分析日常维修问题,整理编制相关指导手册、各类运维文档及相关工作技术文档。
岗位要求:
1.计算机、电子类专科学历及以上,有2年以上相关工作经验;
2.熟悉品牌服务器的管理维护,厂商的支持流程,能熟练判断并解决相关软硬件故障;
3.熟悉 Prometheus Grafana 监控组件;
4.熟悉容器技术,有 K8S 及 Docker 的使用和维护经验;
5.熟悉常用的语言脚本(如Shell Python);
6.熟悉常见的网络设备,华为、H3C 等设备;
7.加分项目:有智算或者超算领域工作经验、熟悉 AI 集群设计、存储设计、高性能网络设计,等相关运维经验;
8.具有解决突发事件的能力;责任心强,有良好的沟通能力、协作能力、学习能力,吃苦耐劳。