深度学习加速工程师

公司简介:墨芯人工智能(Moffett AI)成立于2018年,总部位于中国深圳,在上海、北京、硅谷设有全球办公室。墨芯拥有全球领先、自主研发的稀疏化算法,是双稀疏算法的发明者,拥有全球专利30余项。墨芯通过颠覆性的稀疏计算技术,为AI计算带来从底层架构到硬件的全面革新,从根本上突破算力增长的瓶颈。

岗位职责:

1. 研发和优化算法模型的推理/训练速度,并部署到实际的芯片系统中。

2. 构建性能分析工具链,定位性能瓶颈,形成技术和性能突破。

3. 涉及软件和硬件层面的加速,比如GPU/TPU的使用。

4. 可选深度学习编译器前端(MLIR/XLA),实现模型到异构硬件的自动优化;面向GPU/TPU/NPU的定制化算子库,优化CUDA核心计算效率;开发混合精度推理框架,支持FP8/INT4等新型数值格式等。

任职要求:

1. 硕士及以上学历,计算机/电子信息/物理/数学专业,精通PyTorch/TensorFlow框架,熟悉ONNX。

2. 熟悉模型量化、剪枝、投机解码等算法,在实际项目中应用过2类以上的网络架构,如CNN、RNN、Transformer、LLM、VLM、MLLM等。

3. 熟悉框架(如vLLM、llama.cpp、CUDA、TensorRT等)的底层,了解分布式推理。

3. 有较强的调优、精度评估和实验分析能力。

加分项:

了解编译器优化或芯片指令集开发经验(如RISC-V AI扩展)。

了解LLVM编译器架构,熟悉TVM/Halide等中间表示优化技术

了解高性能计算。

工作地点:上海/深圳

公司地点:深圳南山区弘毅大厦深圳市南山区弘毅大厦9楼CD室

公司简介:

职位发布者:陈女士

墨芯人工智能科技(深圳)有限公司

融资阶段:

公司规模:

相似职位: