岗位职责
1. 基于自研内核架构,进行kernel级高性能算子库开发与性能优化;
2. 和编译器团队紧密配合,针对硬件体系结构对算法进行分析,设计,和优化;
3. 对现有CUDA程序进行改写和适配.
任职资格
1. 计算机/电子工程/数学/物理;
2. 精通数据级并行程序设计和GPGPU编程,例如CUDA、OpenCL;
3. 精通 C/C++代码的编译、调试、分析和性能优化流程;
4. 熟悉计算机体系结构,具有并行算法编程,调试,与优化经验;
5. 熟悉Linux开发环境。
加分项:
1. ACM竞赛经历;
2. MPI等并行编程经验;
3. LLM相关算子开发优化经验。