大模型SFT强化学习高级算法专家-信息研发

任职要求：

1、5年以上AI领域研发经验，具有一定的团队管理经验

2、深入理解Transformer架构和大模型技术体系，掌握LLM最新研究进展

3、具备大规模模型训练和优化经验，熟悉分布式训练框架

4、对模型压缩、知识蒸馏、参数高效微调等技术有深入研究

5、掌握Megatron/DeepSpeed等分布式训练框架

6、有大型AI系统架构设计经验，了解大模型产品化落地要求

加分项：

1、在顶级会议/期刊发表过高水平论文

2、主导过大语言模型或多模态模型的研发

3、有知名开源项目维护经验

4、具备AI领域应用落地的系统经验1、负责大模型应用训练团队的技术方向规划和团队建设，制定大模型应用场景训练优化的技术路线图

2、带领团队完成应用场景下，大模型训练、推理、优化等关键技术挑战

3、统筹大模型后训练、领域适配、知识注入等核心项目的研发进度

4、与产品、工程等团队紧密协作，确保项目高效交付

5、负责团队的技术创新和人才培养，建立技术壁垒

公司地点：北京朝阳区利星行广场C座