云原生开发工程师

职位描述

1、负责云原生平台的架构设计、开发与优化,深入应用Docker和Kubernetes技术,确保系统的高效性和可扩展性;

2、主导单机和集群环境的部署与管理,优化资源调度策略,提升系统性能和稳定性;

3、负责GPU算力卡的驱动适配、算力管理与调度,确保GPU资源的高效利用;

4、解决云原生平台运行中的复杂技术问题,设计并实现异常处理机制,保障系统的可靠性;

5、推动云原生技术的落地与创新,完成技术沉淀与团队能力提升。

职位要求

1、本科及以上学历,计算机科学、计算机工程或相关技术领域专业,5年以上云原生开发经验;

2、深入理解Docker和Kubernetes技术细节,具备单机和集群环境的部署、管理及优化经验;

3、熟悉GPU算力卡的驱动安装、配置与优化,具备算力管理和调度的实际经验;

4、精通至少一种编程语言,包括但不限于Python、Go、Java,具备良好的编码能力和工程化思维;

5、熟悉微服务架构,具备云原生生态相关工具(如Prometheus、Istio、Helm等)的使用经验;

6、具备较强的系统设计和架构能力,能够独立完成复杂系统的分析与设计;

7、优秀的沟通能力、团队协作能力及抗压能力,对技术有强烈的责任感和热情。

加分项

1、有大规模云原生平台开发经验,熟悉高并发、高可用系统的设计与实现;

2、熟悉GPU资源调度框架(如NVIDIA K8s Device Plugin、GPU Operator等),具备相关优化经验;

3、有AI或大数据平台开发经验,熟悉模型训练、推理等场景下的算力管理;

4、熟悉CI/CD流程,具备自动化运维和DevOps实践经验;

5、参与过开源项目或有技术博客分享经验,具备较强的技术影响力。

公司地点:上海徐汇区星云1号大厦12楼

公司简介:

职位发布者:萧女士

上海库帕思科技有限公司

融资阶段:

公司规模:

相似职位: