工作职责:
1、负责大型语言模型的训练和优化工作,比如预训练、微调、RLHF等,提升模型在对话等业务场景中的性能;
2.、分析业务需求,与产品和开发团队紧密合作,设计和实施模型解决方案,提升产品的智能化水平和用户体验;
3、 跟踪最新的研究成果,评估和引入可能提升模型性能、带来产品创新的新技术和方法。
任职要求:
1、计算机科学、人工智能、统计学或相关领域的硕士及以上学历;
2、3年以上自然语言处理领域的研发经验,具有深厚的算法基础,对大模型的基本概念、技术和最佳实践有深入理解;
3、至少精通一门编程语言,如Python、Go、Java,熟悉TensorFlow、PyTorch等深度学习框架,熟悉transformers、DeepSpeed、Megatron等训练优化框架;
4、对大模型架构有深入了解,如Transformer、BERT、GPT等经典模型,LLaMA、Mistral等主流模型,在大模型的预训练、微调、强化学习、RAG、长文本等中的多个方向有深入理解和实践经验;
5、具备丰富的和产品业务团队、开发团队沟通的经验,以及将大模型应用于解决实际业务问题的经验,能够独立实现和优化模型以满足业务需求;
6、具备良好的团队合作精神,优秀的沟通能力和项目管理能力;
7、具备良好的代码开发能力;
8、具备较强的问题解决能力和创新思维。
【加分项】
1、具有带领或管理技术团队的经验,包括规划项目、分配任务、监督进度和促进团队成员之间的协作;
2、在自然语言处理等领域的顶级会议或期刊有发表论文的记录,或参与过相关的技术竞赛并取得优异成绩;
3、具有与外部合作伙伴沟通协调的经验,能够有效地管理外部资源和关系以推进项目目标;
4、有相关行业工作经验和产品化项目经验者。