1、负责云原生Al Infra技术架构设计、推理场景系统优化、云原生AI套件等开发工作.
2、负责研发Al异构计算软件栈, 通过结合不同硬件,高性能网络、缓存等技术, 实现AI计算的全链路优化, 助力打造高可靠、高性能、 高效率的AI算力基础设施
3、洞察人工智能及深度学习的发展趋势, 积极参与下一代Al基础设施的设计与研发。
职位要求
1、对大模型推理引擎、K8s、容器、网络,分布式、GPU架构、云原生Al等方面技术有深入研究;
2、熟悉kubernetes工作原理, 熟悉调度器、资源扩展机制、容器运行时、容器网络等技术;
3、具备扎实的工程能力, Go、 C/C++、 Python等开发语言, 具有丰富的开发、调试和性能优化等经验;
4、熟悉主流深度学习框架(例如PyTorch)、推理引擎框架 (vLLM.SGLang) , Kubeflow, volcano,并对底层实现有一定了解, 在模型训练或推理性能优化方面有实操经验:
5、对Al系统的性能分析工具、GPU架构、高性能网络、高性能缓存.大模型原理等技术有深入理解,有开发和优化经验;
6.根据业务实际场景优化容器运行时,推动RunC,Kata 等MicroVM容器运行时的迭代,提供资源隔离能力,优化应用运行稳定性;