【优势背景】
1、熟悉主流深度学习框架(Pytorch/Tensorflow/ONNX/PaddlePaddle/Mindspore)者优先。
2、具备模型推理部署相关项目经验者优先、
3、了解如量化、剪枝、蒸馏等模型推理加速算法者优先。
4、熟悉业界主流大模型的适配与性能优化,参与过多机多卡、量化压缩、动态调度等性能提升技术者优先
4、了解LLM大模型原理、多模态VLM开源模型结构、扩散模型、Transformer结构、文生图/文生视频等,具备相关项目经验者优先。
5、了解TensorRT等业界推理引擎软件栈者优先。