岗位职责:
1. 优化Torch Compile模式下各类神经网络的性能,包括网络性能瓶颈分析、编译耗时优化、codegen性能优化等;
2. 紧跟PyTorch社区最新技术进展,及时将前沿性能优化技术迁移到MLU平台,保持技术竞争力和创新性;
岗位要求:
1. 有较强的C++和Python功底,有扎实的数据结构和算法基础;
2. 学习能力强,有强烈的求知欲和自我驱动能力,良好的通能力和团队协作能力;
3. 加分项1:熟悉PyTorch/TensorFlow等主流深度学习框架,熟悉框架内部的模块、机制。
4. 加分项2:熟悉torch inductor、Triton、XLA、MLIR、TVM等深度学习编译技术;