AlInfra研发工程师(大模型推理优化方向)

岗位职责

1. 负责大模型推理性能优化,利用量化、算子融合、编译优化等技术,充分发挥GPU、NPU等异构硬件的性能潜力。

2.设计和开发高性能AI算子库,包括常规算子和融合算子,提升各类AI模型在不同硬件平台上的计算效率。

职位要求:

1. 本科及以上学历,计算机、电子、自动化、软件等相关专业,有大模型优化经验者优先。

2.熟悉C/C++,Python等,具备扎实的编程功底和数据结构、算法基础。

3.深入理解GPU、NPU等异构硬件架构,熟悉CUDA编程模型,具备丰富的性能优化经验。

4.熟悉主流深度学习框架(如PyTorch)和推理加速库(如TensorRT、vLLM、SGLang等)。

5.了解常见的大模型结构(如Transformer、Diffusion)和加速技术(如FlashInfer、Flash Attention等)。

公司地点:杭州西湖区杭州蒋村商务中心B1座9楼

公司简介:

职位发布者:薛女士

浙江讯盟科技有限公司

融资阶段:

公司规模:

相似职位: