岗位职责
理解主流DNN模型架构,理解主流硬件加速器架构的设计和优劣,通过性能模型和测试集构建完成的软硬件协同设计工具集,提供设计分析与指导。
任职资格
1.熟悉主流模型架构与相关技术(如transformer, DiT, ViT, Diffusion等)
2. 熟悉GPU上算子编程与优化
3. 熟悉GPU上性能建模与性能测量
4.有过深度学习编译器(图和或算子级)经验者优先考虑
5. 熟悉分布式通信库(NCCL)、网络拓扑(片上和片间)、集群组网等优先考虑
6.熟悉不同硬件加速芯片架构者优先考虑
7.学历:硕士及以上或有过2+年经验的本科