职位描述:
你将至少担任以下职责之一:
•为多种深度学习加速硬件编写算子库
•为各类网络模型制定和实现编译器优化技术
•构造从边缘侧到云端分布式,模型算法训练和推理所需的图切分和张量分片技术
职位要求:
•强大的团队协作和以产品为导向团队中工作的能力
•精通 C/C++, python 等编程语言,有 CPU 或 GPU 上高性能计算相关的编程经验
•熟悉 pytorch 和 onnxruntime 等开源框架,了解 MLIR,TVM 等编译优化框架
加分项:
•熟悉 RISC-V vector,ARM NEON,intel AVX 等向量化加速指令集
•有 TVM、MLIR、XLA、OpenAI Triton等 深度学习编译器开发经验
•熟悉常见 CNN 和 transformer 算法模型
•有指导初级工程师和实习生的经历
•对系统级架构有深入了解,比如存储器层次结构,中断和 IO 映射等