千帆大模型算法

岗位职责:

1、建设在重点应用场景效果领先的大模型;

2、研究持续预训练(CPT)及退火训练技术,通过高质量领域数据增强垂直领域基座模型;

3、研究垂直领域的奖励规则和奖励模型,通过强化学习后训练,提升基座模型的领域知识

推理能力;

4、研究前沿的文本/多模态模型架构与高效的训练推理技术,在先进模型结构、对齐训练算

法、强化学习、推理时 scaling、高效奖励模型设计、视觉推理、机制解释等方向深入研究

并产出有影响力的结果。

岗位要求:

1、计算机相关专业,对大模型有兴趣、有信念、有激情;发表过高水平论文的优先;

2、动手实践能力强,有 Pretrain/SFT/RL 等经验者优先,有 Github 相关项目、竞赛项目者

优先-深入研究或参与过主流大模型项目优先;

3、熟悉多模态常用算法, 包括但不限于 InternVL,llava,mini Gemini,Qwen-VL,Shikra

等;

4、动手实践能力强,有多模态模型预训练经验者优先;

5、责任心强,积极主动,有良好的沟通能力和团队合作能力。

公司地点:北京市海淀区上地十街10号

公司简介:

职位发布者:李文静

上海堆卜堆网络科技有限公司

融资阶段:

公司规模:

相似职位: