职位描述
负责自研AI算力芯片的高性能计算方案,基于自研硬件加速特性定制优化A算法,参与智算基础设施
部署与优化(面向客户方案算力交付的可用性评测,规模化部署、组网架构设计,算力使用及性能瓶
颈优化)
结合客户业务场景需求(如训练/推理时延、吞吐量、成本),负责大模型算力选型与适配,主流开源
模型算力适配优化,提供算力架构及模型精度策略等
职位要求
1.计算机/电子工程/人工智能相关专业,硕士及以上学历,1年以上AI算力基础设施或大模型部署优化相
关经验
扎实的编程能力,数据结构及算法功底,精通Python和C++高性能编程
2.
具有cpu/dsp/gpu/npu等硬件架构下高性能计算性能优化经验
3.
熟悉大模型(如Deepseek/Llama/GPT/awen等)结构及其优化方法
4.
熟悉深度学习框架PyTorch,开源大模型分布式训推框架(Megatron/DeepSpeed)和应用框架
5
(vllm/sGLang)
参与过干亿参数大模型的生产级部署项目优先