模型量化部署工程师(J11327)

工作职责:

1. 分析模型特点,将LLM、VLM,CV、KWS等模型部署到对应平台,并提升模型的速度与精度表现 ;

2. 负责开发维护高效统一的模型量化压缩评估工具及模型推理框架,构建模型轻量化能力;

3. 调研、跟踪业界最新的进展,并能在实际业务中落地。

任职资格:

1. 计算机基础扎实,熟练掌握Python、C++等常见开发语言;

2. 了解目前主流的模型及结构,熟悉VLM、LLM、CV、KWS等模型在各个领域的应用;

3. 了解模型优化加速方案,熟悉模型量化、稀疏等算法原理和实现细节;

4. 熟悉模型部署相关流程,如有TensorRT、QNN/SNPE等工具使用经验,熟悉其中量化相关算法与功能;

5. 熟悉Pytorch等工具训练流程,熟悉其中对模型量化等相关的支持,或了解其他量化感知训练相关知识;

6. 熟悉ARM体系架构,有DSP开发经验优先;

7. 有机器学习和视觉算法等竞赛经验优先;

8. 有相关优秀开源项目经验优先。

公司地点:北京朝阳区阿里巴巴·北京朝阳科技园A区A2

公司简介:

职位发布者:曾经理

斑马网络技术股份有限公司

融资阶段:

公司规模:

相似职位: