大模型算法工程师

工作职责：

1、负责大型语言模型的训练和优化工作，比如预训练、微调、RLHF等，提升模型在对话等业务场景中的性能；

2.、分析业务需求，与产品和开发团队紧密合作，设计和实施模型解决方案，提升产品的智能化水平和用户体验；

3、跟踪最新的研究成果，评估和引入可能提升模型性能、带来产品创新的新技术和方法。

任职要求：

1、计算机科学、人工智能、统计学或相关领域的硕士及以上学历；

2、3年以上自然语言处理领域的研发经验，具有深厚的算法基础，对大模型的基本概念、技术和最佳实践有深入理解；

3、至少精通一门编程语言，如Python、Go、Java，熟悉TensorFlow、PyTorch等深度学习框架，熟悉transformers、DeepSpeed、Megatron等训练优化框架；

4、对大模型架构有深入了解，如Transformer、BERT、GPT等经典模型，LLaMA、Mistral等主流模型，在大模型的预训练、微调、强化学习、RAG、长文本等中的多个方向有深入理解和实践经验；

5、具备丰富的和产品业务团队、开发团队沟通的经验，以及将大模型应用于解决实际业务问题的经验，能够独立实现和优化模型以满足业务需求；

6、具备良好的团队合作精神，优秀的沟通能力和项目管理能力；

7、具备良好的代码开发能力；

8、具备较强的问题解决能力和创新思维。

【加分项】

1、具有带领或管理技术团队的经验，包括规划项目、分配任务、监督进度和促进团队成员之间的协作；

2、在自然语言处理等领域的顶级会议或期刊有发表论文的记录，或参与过相关的技术竞赛并取得优异成绩；

3、具有与外部合作伙伴沟通协调的经验，能够有效地管理外部资源和关系以推进项目目标；

公司地点：杭州云创镓谷6号楼6F