1. 从事大模型的训练和优化,包括语言大模型、图文多模态大模型、语音大模型、图像生成大模型,进行模型架构设计和技术攻坚;
2. 将大模型用于内容理解、内容生成,达到工业级的稳定性和规模应用,应用到客服、电话销售、推荐、搜索、广告、供应链数字化等业务。
职位描述
1. 计算机、数学或统计学相关专业硕士及以上学历,具有2年以上计算机大模型/NLP/预训练模型相关工作经验;
2. 熟练使用pytorch/tensorflow等至少一种主流深度学习框架,能够独立实现前沿模型;
3、熟练掌握业界主流大语言模型(GPT、ChatGLM、LLaMA等)的算法原理,掌握SFT、RLHF等训练方式和智能对话等应用范式优先;
4、有大模型训练优化/大模型落地经验/国际顶会论文发表经验优先。