大模型算法工程师

岗位职责:

1、负责将大模型从理论研究转化为2B/2C的落地应用,包括系统设计,训练、微调、推理以及各环节优化;

2、与产品团队紧密合作,理解业务需求,设计并实现大模型解决方案;

3、负责解决大模型在生成质量、生成性能、安全性方面的算法优化问题;

4、跟踪最新的行业动态和技术发展,通过研究论文、技术会议、行业先进案例等途径不断提升大模型专业知识和产品解决方案的能力。

任职资格:

1、计算机科学、数学、人工智能、统计学或相关领域的硕士或博士学位,硕士3年以上NLP深度学习算法方向工作经历;

2、具有在大规模数据集上训练大模型的实践经验;

3、熟练掌握主流深度学习框架pytorch/tensorflow,以及大模型常用训练框架、推理架构如Megatron-LM/ DeepSpeed训练框架等多机多卡方案,有百亿/千亿NLP大模型训练调优经验优先;

4、深入了解大模型在产品化过程中的调优、量化、封装、部署、调度、并发、时延等常见软硬件问题,熟悉大模型常用训练框架、推理架构;

5、具备良好的产品意识和出色的问题解决能力,能够独立进行问题分析和解决方案设计,能结合业务需求做大模型方向整体技术与项目规划;

6、在国际AI会议(如NeurIPS、ICML、ACL等)上发表过相关领域的论文,或获得过重要的技术专利,展示了其在大模型领域的技术实力和创新能力;

7、良好的沟通能力和团队合作精神,优秀的沟通和协调能力。

公司地点:北京京东总部1号楼北京通州区京东总部2号楼B座

公司简介:

职位发布者:武先生

北京京东叁佰陆拾度电子商务有限公司

融资阶段:

公司规模:

相似职位: