工作职责:
1.负责大模型微调相关的工作,包括但不限于:数据样本准备,高效训练等
2.探索研究如何从经典IP小说原文中高效的构造SFT训练
样本,提升模型对话能力
3.提升大模型对复杂 prompt 的遵循能力,充分挖掘大模型潜力
4.提升大模型结合检索的能力,探索高效的模型知识嵌入方法以及模型知识在线学习更新等岗位要求:
1.计算机及相关领域硕士及以上学历
2.熟练掌握Python,熟悉Linux环境开发,熟练使用深度学习框架TensorFlow或者PyTorch;
3.熟悉前沿的深度学习和 NLP 算法,熟悉Transformer、GPT等模型结构,了解大模型微调(SFT)相关技术;4.有强烈的责任心和团队合作精神,有技术钻研精神
心态积极,能够主动融入团队;
5.有大模型微调实践经验或者在深度学习领域顶级会议发表过高质量论文者优先;