工作职责:
参与开发针对 Stream Computing NeuralScale 架构的基于 MLIR 的深度学习编译器。具体包括深度学习编译器前端转换、后端代码生成、IR 设计与扩展、图层优化与变换、存储优化、指令集优化等。
岗位要求:
⚫ 本科及以上学历,计算机科学与技术、电子信息相关专业;
⚫ 3 年以上编译器相关开发工作或研究经验;
⚫ 熟练掌握 C、现代 C++,熟悉 Python;
⚫ 熟练掌握程序设计算法与常见数据结构;
⚫ 熟悉编译原理,理解常见的编译优化算法;
⚫ 扎实的计算机体系结构基础,熟悉现代处理器的基本工作原理;
⚫ 熟悉 TensorFlow、PyTorch 等主流深度学习框架;
⚫ 深入理解深度学习模型的程序特征以及在 DSA 芯片上的程序优化方法;
⚫ 良好的口头与书面沟通技巧,有团队协作意识和精神;
⚫ 良好的英语读写能力,阅读英文技术材料无障碍;
⚫ 善于学习新知识,工作积极主动、责任心强,并能够在压力下承担工作。
候选人具备以下经验的优先考虑:
⚫ 具有基于 XLA/TVM/MLIR 的深度学习编译器的实际开发经验;
⚫ 参与过以上编译器开源社区的开发并提交过代码;
⚫ 具有 Transformer、LLM、Stable Diffusion 等模型在 GPU/NPU 上的实际优化经验。