AI高性能计算工程师

职位描述

负责自研AI算力芯片的高性能计算方案，基于自研硬件加速特性定制优化A算法，参与智算基础设施

部署与优化(面向客户方案算力交付的可用性评测，规模化部署、组网架构设计，算力使用及性能瓶

颈优化)

结合客户业务场景需求(如训练/推理时延、吞吐量、成本)，负责大模型算力选型与适配，主流开源

模型算力适配优化，提供算力架构及模型精度策略等

职位要求

1.计算机/电子工程/人工智能相关专业，硕士及以上学历，1年以上AI算力基础设施或大模型部署优化相

关经验

扎实的编程能力,数据结构及算法功底,精通Python和C++高性能编程

具有cpu/dsp/gpu/npu等硬件架构下高性能计算性能优化经验

熟悉大模型(如Deepseek/Llama/GPT/awen等)结构及其优化方法

熟悉深度学习框架PyTorch，开源大模型分布式训推框架(Megatron/DeepSpeed)和应用框架

(vllm/sGLang)

参与过干亿参数大模型的生产级部署项目优先

公司地点：上海浦东新区上海SK大厦1501