千帆大模型算法

岗位职责：

1、建设在重点应用场景效果领先的大模型；

2、研究持续预训练（CPT）及退火训练技术，通过高质量领域数据增强垂直领域基座模型；

3、研究垂直领域的奖励规则和奖励模型，通过强化学习后训练，提升基座模型的领域知识

推理能力；

4、研究前沿的文本/多模态模型架构与高效的训练推理技术，在先进模型结构、对齐训练算

法、强化学习、推理时 scaling、高效奖励模型设计、视觉推理、机制解释等方向深入研究

并产出有影响力的结果。

岗位要求：

1、计算机相关专业，对大模型有兴趣、有信念、有激情；发表过高水平论文的优先；

2、动手实践能力强，有 Pretrain/SFT/RL 等经验者优先，有 Github 相关项目、竞赛项目者

优先-深入研究或参与过主流大模型项目优先；

3、熟悉多模态常用算法, 包括但不限于 InternVL，llava，mini Gemini，Qwen-VL，Shikra

等；

4、动手实践能力强，有多模态模型预训练经验者优先；

5、责任心强，积极主动，有良好的沟通能力和团队合作能力。

公司地点：北京市海淀区上地十街10号