岗位职责:
1、负责服务器硬件、操作系统及云平台的运维管理,确保系统稳定性和高性能。
2、对服务器硬件问题进行诊断和修复,具备独立排查硬件故障的能力。
3、深入分析网络问题,熟练使用抓包工具(如Wireshark、tcpdump)进行网络故障定位。
4、根据业务需求定制操作系统或者初始化脚本。
5、管理和维护算力资源池,确保平台运行正常。
6、编写自动化运维脚本(如Shell/Python),提升运维效率。
7、参与制定运维规范和灾难恢复方案,保障业务连续性。
8、遵循ITIL流程,规范管理服务器上下架、系统重装、硬件报修等全生命周期操作,确保流程标准化和可追溯性。
9、对接供应商或IDC,协调处理服务器硬件维修、备件更换等工作。
任职要求:
1、本科及以上,5年以上互联网行业系统运维经验,有大型互联网公司经验更佳。
2、精通Linux/Windows服务器的管理与优化;熟悉IPMI/iDRAC/iLO等带外管理工具;具备操作系统定制化能力(如内核编译、驱动适配)。
3、具备较强的排障能力,能够快速定位硬件及系统级故障(如磁盘故障、内核崩溃),熟练使用网络抓包工具分析TCP/IP协议、延迟、丢包等问题。
4、熟悉至少一家主流云厂商(AWS、阿里云、Azure等)的产品及服务。有资源管理、成本优化经验者优先。
5、熟悉ITIL框架,具备IT服务管理(如事件管理、变更管理、问题管理)实战经验。熟练服务器上下架、系统重装、硬件报修等标准化流程。
加分项:熟悉容器化技术(Docker/Kubernetes)或自动化运维工具(Ansible/Puppet)。
天翼云是国有特大型通信骨干企业中国电信旗下一家科技型、平台型、服务型公司,注册资本47亿元人民币。天翼云以“云网融合、安全可信、绿色低碳、生态开放”四大优势向客户提供公有云、私有云、专属云、混合云、边缘云全栈云服务,满足政府机构、大中小企业数字化转型需求。天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务。目前,天翼云作为国云的框架已经成型。