岗位职责
1、负责CV、NLP、LLM等模型推理库研发;
2、负责对接其它团队推理优化需求;
3、负责解决在线推理系统的性能问题;
4、负责培养团队成员推理服务能力。
任职要求
1、985大学计算机相关专业全日制硕士或者博士毕业;至少带过5人以上团队;
2、具有在AI部署领域5年以上的工作经验;
3、熟练掌握CUDA以及C++,编程语言基础扎实;熟悉计算机体系结构和操作系统原理;
4、深入了解常见的推理框架实现细节,能够部署各种类型的模型;
5、有模型部署效率优化经验,有至少三个大项目的优化落地经验;
6、熟悉Huggingface Transformer库的设计和使用;熟悉常用的调度算法,熟悉triton等调度框架;熟悉Pytorch;
7、数学知识扎实,具有了解业界发展动态以及复现论文算法的能力;有较强的沟通能力;能够培养团队成员综合能力,提升团队整体效能。
具有以下条件者优先
计算机领域相关的编程大赛获奖者优先;有AI算法或系统相关论文发表者优先;有HPC或AI系统优化经验者优先;有Stable Diffusion等大模型优化落地项目者优先;熟悉Pytorch底层IR者优先。