岗位职责
1. 负责大模型推理性能优化,利用量化、算子融合、编译优化等技术,充分发挥GPU、NPU等异构硬件的性能潜力。
2.设计和开发高性能AI算子库,包括常规算子和融合算子,提升各类AI模型在不同硬件平台上的计算效率。
职位要求:
1. 本科及以上学历,计算机、电子、自动化、软件等相关专业,有大模型优化经验者优先。
2.熟悉C/C++,Python等,具备扎实的编程功底和数据结构、算法基础。
3.深入理解GPU、NPU等异构硬件架构,熟悉CUDA编程模型,具备丰富的性能优化经验。
4.熟悉主流深度学习框架(如PyTorch)和推理加速库(如TensorRT、vLLM、SGLang等)。
5.了解常见的大模型结构(如Transformer、Diffusion)和加速技术(如FlashInfer、Flash Attention等)。