大模型SFT强化学习高级算法专家-信息研发

任职要求:

1、5年以上AI领域研发经验,具有一定的团队管理经验

2、深入理解Transformer架构和大模型技术体系,掌握LLM最新研究进展

3、具备大规模模型训练和优化经验,熟悉分布式训练框架

4、对模型压缩、知识蒸馏、参数高效微调等技术有深入研究

5、掌握Megatron/DeepSpeed等分布式训练框架

6、有大型AI系统架构设计经验,了解大模型产品化落地要求

加分项:

1、在顶级会议/期刊发表过高水平论文

2、主导过大语言模型或多模态模型的研发

3、有知名开源项目维护经验

4、具备AI领域应用落地的系统经验1、负责大模型应用训练团队的技术方向规划和团队建设,制定大模型应用场景训练优化的技术路线图

2、带领团队完成应用场景下,大模型训练、推理、优化等关键技术挑战

3、统筹大模型后训练、领域适配、知识注入等核心项目的研发进度

4、与产品、工程等团队紧密协作,确保项目高效交付

5、负责团队的技术创新和人才培养,建立技术壁垒

公司地点:北京朝阳区利星行广场C座

公司简介:

职位发布者:李文举

上海堆卜堆网络科技有限公司

融资阶段:

公司规模:

相似职位: