Infra开发工程师

岗位职责:

1. 负责GPU云原生基础设施研发,包括Device Plugin、Exporter、Container Toolkit、Operator等组件的设计与开发,持续优化GPU云原生技术体系;

2. 负责AI软件栈的集成与持续交付,完成软件栈编译与打包,包括deb、rpm和run格式,开发环境构建与编译工作流实现,建立自动化CI/CD流程,保障软件栈高效稳定交付;

3. 负责内部智能化平台及Agent系统的设计与开发,包括集成平台和Workflow Agent,结合大模型与vLLM服务,实现研发效率提升与智能化;

4. 关注云原生推理框架,例如Aibirx和LLM-D,以及分布式任务框架Ray,在Kubernetes环境下进行部署和调度,并结合自家GPU进行适配优化。

任职资格:

1. 熟悉至少一门编程语言,例如Python、C++或Golang,熟悉Linux操作系统和Shell脚本;

2. 熟悉Docker和Kubernetes;

3. 熟悉前后端主流技术栈,包括 Vue、Kafka、Gin、GoZero、gRPC 、postgresql等,并具备微服务架构设计与实践经验;

4. 熟悉常见的Agent和工作流框架,例如LangChain、n8n、Dify和Argo Workflow;

5. 了解云原生AI推理框架以及分布式任务框架,例如Aibirx、LLM-D、Ray等。

公司地点:上海浦江智慧广场3号楼5楼

公司简介:

职位发布者:孙女士

上海天数智芯半导体股份有限公司

融资阶段:

公司规模:

相似职位: