深度学习框架图编译工程师

岗位职责:

1. 优化Torch Compile模式下各类神经网络的性能,包括网络性能瓶颈分析、编译耗时优化、codegen性能优化等;

2. 紧跟PyTorch社区最新技术进展,及时将前沿性能优化技术迁移到MLU平台,保持技术竞争力和创新性;

岗位要求:

1. 有较强的C++和Python功底,有扎实的数据结构和算法基础;

2. 学习能力强,有强烈的求知欲和自我驱动能力,良好的通能力和团队协作能力;

3. 加分项1:熟悉PyTorch/TensorFlow等主流深度学习框架,熟悉框架内部的模块、机制。

4. 加分项2:熟悉torch inductor、Triton、XLA、MLIR、TVM等深度学习编译技术;

公司地点:北京海淀区北航致真大厦D座

公司简介:

职位发布者:熊先生

中科寒武纪科技股份有限公司

融资阶段:

公司规模:

相似职位: