岗位职责:
1、负责大语言模型开发和优化,包括但不限于预训练、SFT、指令微调、Prompt工程、模型评估、模型推理等;
2、与数据团队配合完成行业大模型的数据收集、清洗、标注、特征优化等相关工作;
3、结合业务需要,推进大模型在各场景落地,根据客户反馈持续优化模型效果;
4、跟进和探索大模型相关的前沿技术。
任职要求:
1、应用统计、数学相关专业,熟悉深度学习、计算机视觉、自然语言处理等领域的专业知识,具有3年以上工作经验;
2、熟悉Transformer、BERT、GPT、Llama等模型工作原理;
3、有开源大模型的使用及微调经验,熟悉常见的模型微调方法(prompt-tuning/lora/qlora/p-tuning等) ;
4、熟悉Pytorch/Tensorflow深度学习框架,至少掌握Python或C++其中一种编程语言;
5、具有RAG落地应用开发经验;
6、有接触或者实操过大模型的二次开发;
7、具备较强的团队协作能力和沟通能力,有较强的学习能力和问题解决能力。