岗位职责:
1)设计和实施大语言模型的训练策略和框架,包括模型微调、正则化、优化以及并行化策略;
2)运用算法理论知识,针对单机单卡和单机多卡的训练环境,优化模型训练的计算性能和内存使用;
3)通过深入理解业务需求,训练定制垂直模型以达到预期的质量和性能,并推动模型在生产环境中的部署;
4)对开源大模型能够使用Fine-tuning、LoRA等训练模式及模型参数调优;
5)调研并探索LLM方向前沿算法,包括但不限于数据处理、预训练、指令精调、RLHF等,持续提升现有算法能力和效果。
岗位要求:
1)本科及以上学历,计算机科学、电子信息工程、软件工程、人工智能、数学等相关专业优先,党员优先;
2)具备良好的团队协作能力,热爱钻研技术,善于分析、解决工程问题;
3)有深度学习基本知识,熟悉Transformer/Bert/GPT等模型结构更佳;
4)掌握Python/C++编程语言,熟练使用Pytorch训练框架;
5)熟悉Deepspeed/Megatron/Ray等任意一种框架,熟悉训练大模型相关的知识和实践;
6)有机器学习平台开发和深度学习框架开发等领域开发经验;
7)学习意识强,有冒险精神,对事物有强烈的好奇心。
福利政策:
1、薪资架构=基本工资+绩效奖金+其他各类奖金+各类津贴+各类补贴;
2、上班时间8:30-12:00、13:30-18:00,周末双休,享受国家法定节假日,入职即享五险一金;
3、每年调薪机会不低于1次,完善内部晋升机制(垂直晋升,平行晋升)