量化研究员

大模型算法研究员
工作职责:
1、负责基于电商直播和企业经验的大模型训练,针对大模型的微调算法的设计、训练、微调、优化、部署上线;
2、参与模型的量化和加速,实现高效的模型压缩和部署,提高模型的运行效率和推理速度;
3、能够带领项目小组完成技术难点攻克;
任职资格:
1、计算机、数学等相关专业985硕士及以上学历;
2、5年及以上算法工作经验,具备大模型结合应用落地经验,具备良好的数学理论基础和逻辑能力,自学能力强;
3、扎实的代码基础,熟悉PyTorch/Tensorflow深度学习框架;
4、熟悉Transformer、BERT、GLM等模型,对大模型数据处理及训练技术如LoRA、sft、RLHF等有较强深入理解;
5、熟悉分布式训练框架,如deepspeed、Megatron-LM优先;
6、在模型蒸馏、模型量化、训练及推理加速等方面有一定经验;

公司地点:杭州余杭区杭州遥望网络科技有限公司A1

公司简介:

职位发布者:孙先生

杭州遥望网络科技有限公司

融资阶段:

公司规模:

相似职位: