学历要求:
211,985全日制本科及其以上
职责描述:
1. 负责机器学习模型、深度神经网络模型、大语言模型多端部署
2. 负责大语言模型(LLM)剪枝、量化、蒸馏等模型推理加速
3. 负责AI产品中算法集成、验证、测试
4. 负责业务领域AIGC、RAG、Agent等大模型算法集成应用
任职要求
1. 熟练掌握C、C++、python、go、java等主流开发语言一种或多种
熟悉TensorRT、vLLM、mnn等常用深度学习推理框架,有高并发部署经验者优先。
2 . 熟悉ASR、TTS常见模型部署,熟悉多模型调度策略,有NLP,ASR,TTS 全链路部署经验优先
熟悉常用深度学习框架PyTorch/Tensorflow分布式推理
有较好的英语基础,能够用英语和团队成员交流,良好的英语文献阅读能力。