工作职责:
1、负责算子加速库的研发;
2、负责分析模型性能瓶颈,针对特定异构硬件平台(GPU/AI芯片)进行高性能计算加速和优化。
岗位要求:
1、熟练掌握cuda/华为昇腾atb/triton编程语言;
2、熟练掌握C++/Python,编程语言基础扎实;
3、熟悉计算机体系结构及操作系统原理;
4、熟悉深度学习算法,对主流深度学习框架有一定的应用或开发经验,了解主流深度学习模型;
5、优秀的分析问题和解决问题的能力。
具有以下条件者优先:
1、计算机领域相关的编程大赛获奖者优先;
2、有AI算法或系统相关论文发表者优先;
3、熟悉AI领域常见框架、模型,有过实战调优经验者优先;
4、有AI系统优化经验者优先;
5、了解大模型算法和优化方法者优先;
6、熟悉TVM, Triton, MLIR优先。