岗位目标和职责 :
1、利用AIGC大模型、机器学习、深度学习等人工智能技术实现IT系统运维智能化,提高运维效率,降低运维风险,降低系统故障率和修复时间;
2、将IT运维的知识文档、流程数据、监控告警、日志等数据汇总处理,涉及知识库管理、异常检测、故障定位等前沿算法模型的研究及应用;
3、构建智能化运维AI算法框架,实现多模型算法平台;
4、负责运维场景分析、数据调研、算法应用实施工作,包括算法模型设计、开发、训练、验证及优化;
5、实现智能运维场景包括但不限于事件分析建议、变更风险分析、智能异常检测、诊断归因、根因分析等场景。
岗位要求:
1、本科及以上学历,计算机相关专业;
2、5年以上数据挖掘、机器学习相关工作经验;
3、熟悉常用的机器学习和数据挖掘原理与算法;
4、良好的数据结构、数理统计和概率论等基础,优秀的编码能力,熟练掌握 Python/SQL语言, PyTorch;
5、AIOps智能运维相关背景优先,熟悉ITSM/ITIL运维体系,了解运维工单流程、监控告警、日志管理、调用链路、运营分析工具系统;
6、深刻理解图文相关的机器学习/深度学习算法,优化模型/策略;
7、有NLP、CV、AIGC、多模态、智能对话、RAG、LLM Agent开发等前沿AI技术有比较深入的了解和研究,有实际的项目经验优先;
8、能够熟练使用Scikit Learn、Pandas、Numpy和Scipy开发框架。