岗位职责:
1、建设在重点应用场景效果领先的大模型;
2、研究持续预训练(CPT)及退火训练技术,通过高质量领域数据增强垂直领域基座模型;
3、研究垂直领域的奖励规则和奖励模型,通过强化学习后训练,提升基座模型的领域知识
推理能力;
4、研究前沿的文本/多模态模型架构与高效的训练推理技术,在先进模型结构、对齐训练算
法、强化学习、推理时 scaling、高效奖励模型设计、视觉推理、机制解释等方向深入研究
并产出有影响力的结果。
岗位要求:
1、计算机相关专业,对大模型有兴趣、有信念、有激情;发表过高水平论文的优先;
2、动手实践能力强,有 Pretrain/SFT/RL 等经验者优先,有 Github 相关项目、竞赛项目者
优先-深入研究或参与过主流大模型项目优先;
3、熟悉多模态常用算法, 包括但不限于 InternVL,llava,mini Gemini,Qwen-VL,Shikra
等;
4、动手实践能力强,有多模态模型预训练经验者优先;
5、责任心强,积极主动,有良好的沟通能力和团队合作能力。