【岗位职责】
1、研究和使用大模型技术,提供解决方案并进行应用实现;
2、负责研发和优化大模型的训练和部署技术,提升模型效率和性能;
3、参与开源大模型的开发和维护工作,提高模型的普遍性和适用性;
4、跟踪并应用大模型领域的最新研究成果,进行技术的创新和优化;
5、与团队紧密合作,保证大模型技术的顺利实施和应用;
【任职要求】
1、计算机、人工智能或相关专业研究生及以上学历,3年以上大模型相关经验优先;
2、具备扎实的编程技能,熟悉Python等常用编程语言,掌握Pytorch、tensorflow,Paddlepaddle等相关深度学习框架;
3、掌握训练大模型的训练流程(SFT/RW/RLHF);
4、了解数据并行,张量平行等相关分布式训练方法,熟悉常用大模型分布式框架例如deepspeed,Megatron-LM;
5、有NLP或大模型相关项目经验,有大模型推理优化相关经验,了解ChatGLM、LLaMA等相关模型原理;
6、具备良好的团队合作精神和沟通能力,有医疗领域,发表过顶会论文者优先;