岗位职责:
1.从事大模型的训练和优化,包括语言大模型进行模型架构设计和技术攻坚;
2.将大模型用于内容理解、内容生成,达到工业级的稳定性和规模应用,应用到客服、电话销售、供应链数字化、商家咨询等业务。
岗位要求:
1、计算机、数学或统计学相关专业硕士及以上学历,具有2年以上计算机NLP/预训练模型相关工作经验;
2、熟练使用pytorch/tensorfow等至少一种主流深度学习框架,能够独立实现前沿模型;
3、孰练掌握业界主流大语言模型(GPT.ChatGM、LaMA等)的算法原理,掌握SET.RLHE等训练方式和智能对话等应用范式优先:
4、有大模型训练优化/大模型落地经验/国际顶会论文发表经验优先。