云原生AI Infra工程师

1、负责云原生Al Infra技术架构设计、推理场景系统优化、云原生AI套件等开发工作.

2、负责研发Al异构计算软件栈, 通过结合不同硬件,高性能网络、缓存等技术, 实现AI计算的全链路优化, 助力打造高可靠、高性能、 高效率的AI算力基础设施

3、洞察人工智能及深度学习的发展趋势, 积极参与下一代Al基础设施的设计与研发。

职位要求

1、对大模型推理引擎、K8s、容器、网络,分布式、GPU架构、云原生Al等方面技术有深入研究;

2、熟悉kubernetes工作原理, 熟悉调度器、资源扩展机制、容器运行时、容器网络等技术;

3、具备扎实的工程能力, Go、 C/C++、 Python等开发语言, 具有丰富的开发、调试和性能优化等经验;

4、熟悉主流深度学习框架(例如PyTorch)、推理引擎框架 (vLLM.SGLang) , Kubeflow, volcano,并对底层实现有一定了解, 在模型训练或推理性能优化方面有实操经验:

5、对Al系统的性能分析工具、GPU架构、高性能网络、高性能缓存.大模型原理等技术有深入理解,有开发和优化经验;

6.根据业务实际场景优化容器运行时,推动RunC,Kata 等MicroVM容器运行时的迭代,提供资源隔离能力,优化应用运行稳定性;

公司地点:上海徐汇区西岸凤巢AI PLAZA南区43

公司简介:

职位发布者:邵经理

上海智能算力科技有限公司

融资阶段:

公司规模:

相似职位: