岗位职责:
1、负责自建AI计算集群的项目整体架构设计与完善、牵头系统部署、外协管理。
2、负责管理自建 AI 计算集群的调度、运维工作。
3、负责自建 AI 平台的前后端软件的问题跟踪与解决。
任职要求:
1、具备IT行业背景和3年以上工作经验。
2、具备独立构建和运维小规模AI计算集群的经验,能够排查基本的硬件问题和系统问题、优化架构及应用性能。
3、具备一定的前端或后端开发经验,能够基于常见的前端框架完成简单的web端和PC端界面开发,能够完成简单的数据库开发。
4、熟练掌握Linux操作系统;熟悉Linux的安装、配置、调优和排障及常见配置管理和运维工具。
5、精通 docker 技术,熟悉TCP/IP、HTTP等协议,有良好的网络、存储、中间件、安全、计算机体系结构方面的知识。
6、有k8s平台运维经验者优先,熟悉微服务、Mesh、Serverless、DevOps等云原生技术者优先,有运维自动化工具平台建设经验者优先。
7、有长期前后端开发项目经历,且项目稳健运行1年以上者优先。