深度学习加速工程师

公司简介：墨芯人工智能（Moffett AI）成立于2018年，总部位于中国深圳，在上海、北京、硅谷设有全球办公室。墨芯拥有全球领先、自主研发的稀疏化算法，是双稀疏算法的发明者，拥有全球专利30余项。墨芯通过颠覆性的稀疏计算技术，为AI计算带来从底层架构到硬件的全面革新，从根本上突破算力增长的瓶颈。

岗位职责：

1. 研发和优化算法模型的推理/训练速度，并部署到实际的芯片系统中。

2. 构建性能分析工具链，定位性能瓶颈，形成技术和性能突破。

3. 涉及软件和硬件层面的加速，比如GPU/TPU的使用。

4. 可选深度学习编译器前端（MLIR/XLA），实现模型到异构硬件的自动优化；面向GPU/TPU/NPU的定制化算子库，优化CUDA核心计算效率；开发混合精度推理框架，支持FP8/INT4等新型数值格式等。

任职要求：

1. 硕士及以上学历，计算机/电子信息/物理/数学专业，精通PyTorch/TensorFlow框架，熟悉ONNX。

2. 熟悉模型量化、剪枝、投机解码等算法，在实际项目中应用过2类以上的网络架构，如CNN、RNN、Transformer、LLM、VLM、MLLM等。

3. 熟悉框架（如vLLM、llama.cpp、CUDA、TensorRT等）的底层，了解分布式推理。

3. 有较强的调优、精度评估和实验分析能力。

加分项：

了解编译器优化或芯片指令集开发经验（如RISC-V AI扩展）。

了解LLVM编译器架构，熟悉TVM/Halide等中间表示优化技术

了解高性能计算。

工作地点：上海/深圳

深度学习加速工程师

公司地点：深圳南山区弘毅大厦深圳市南山区弘毅大厦9楼CD室

公司简介：

职位发布者：陈女士

融资阶段：

公司规模：

相似职位：