大模型算法工程师(LLM)

岗位职责:

1. 参与基础大模型和端侧大模型的研发工作,包括架构设计、预训练、后训练等,端到端构建通用能力业界领先的大模型。

2. 负责大模型高阶能力(Coding、Agent等)的专项提升,打造模型长版特性。

3. 持续关注大模型最新研究,探索下一代大模型的架构和训练方法,做出有影响力的成果。

任职要求:

'1. 硕士及以上学历,计算机科学、人工智能等相关专业;

2. 熟悉深度学习框架(例如pytorch等),具备大模型和端侧大模型的算法开发经验,具备数据处理、模型架构设计、大规模训练等经验;

3.对大模型架构、训练、数据、系统优化中的某一方面有深入理解,

以下符合1条以上:

1) 能够提出创新性的大模型架构和端侧大模型架构,探索技术的下一跳。

2)熟练掌握强化学习(RL)和模型微调(SFT)等后训练技术,并可以提出创新的后训练方法。

3)对coding、math、agent等大模型高阶能力有深入思考

4)熟练掌握大模型预训练的Know How,可以快速诊断并修复问题,提升模型能力。

5)对预训练数据、后训练数据的生产、合成方法有深入理解

6)熟练模型训练/推理的系统优化方法,提升模型的实际训练、推理性能。

4有大模型/端侧大模型架构、训练、数据、系统优化等相关实战经验者优先;在NeurIPS/ICML/ICLR/ACL/EMNLP/CVPR/ICCV/TPAMI等AI顶级会议发表过相关论文者优先

公司地点:北京太阳宫大厦

公司简介:

职位发布者:gale洋洋

亨特海(北京)人力资源有限公司赤峰分公司

融资阶段:不需要融资

公司规模:100~499人

相似职位: