工作职责:
1. 分析模型特点,将LLM、VLM,CV、KWS等模型部署到对应平台,并提升模型的速度与精度表现 ;
2. 负责开发维护高效统一的模型量化压缩评估工具及模型推理框架,构建模型轻量化能力;
3. 调研、跟踪业界最新的进展,并能在实际业务中落地。
任职资格:
1. 计算机基础扎实,熟练掌握Python、C++等常见开发语言;
2. 了解目前主流的模型及结构,熟悉VLM、LLM、CV、KWS等模型在各个领域的应用;
3. 了解模型优化加速方案,熟悉模型量化、稀疏等算法原理和实现细节;
4. 熟悉模型部署相关流程,如有TensorRT、QNN/SNPE等工具使用经验,熟悉其中量化相关算法与功能;
5. 熟悉Pytorch等工具训练流程,熟悉其中对模型量化等相关的支持,或了解其他量化感知训练相关知识;
6. 熟悉ARM体系架构,有DSP开发经验优先;
7. 有机器学习和视觉算法等竞赛经验优先;
8. 有相关优秀开源项目经验优先。