岗位职责:
1、 搭建适用大模型的分布式训练框架和系统, 负责分词、词性分析、实体识别、新词发现等NLP研究工作;
2、 负责大模型增量预训练、高效微调、推理优化和效果评估,完成基于大模型的下游应用任务开发工作;
2、 探索NLP、CV等新技术在业务中的落地和创新,并迅速进行转化;
3、 追踪NLP/多模态等大模型前沿技术。
任职资格:
1、 计算机相关专业全日制统招本科及以上学历,本科3年以上,硕士1年以上相关工作经验;
2、 熟练掌握NLP基础理论和算法,有NLP相关行业经验,熟练掌握Transformer系列模型架构和原理;
3、 熟练掌握python编码语言,熟练使用pytorch、tensorflow、paddle等至少一种深度学习框架;
4、 熟悉使用deepspeed、megatron、colossal-ai等至少一种大模型分布式训练框架,了解langchain原理以及llama、chatglm等常见开源基座大模型。