任职要求:
1、5年以上AI领域研发经验,具有一定的团队管理经验
2、深入理解Transformer架构和大模型技术体系,掌握LLM最新研究进展
3、具备大规模模型训练和优化经验,熟悉分布式训练框架
4、对模型压缩、知识蒸馏、参数高效微调等技术有深入研究
5、掌握Megatron/DeepSpeed等分布式训练框架
6、有大型AI系统架构设计经验,了解大模型产品化落地要求
加分项:
1、在顶级会议/期刊发表过高水平论文
2、主导过大语言模型或多模态模型的研发
3、有知名开源项目维护经验
4、具备AI领域应用落地的系统经验1、负责大模型应用训练团队的技术方向规划和团队建设,制定大模型应用场景训练优化的技术路线图
2、带领团队完成应用场景下,大模型训练、推理、优化等关键技术挑战
3、统筹大模型后训练、领域适配、知识注入等核心项目的研发进度
4、与产品、工程等团队紧密协作,确保项目高效交付
5、负责团队的技术创新和人才培养,建立技术壁垒