大模型预训练算法岗位

岗位职责:

1. 负责大模型预训练算法的设计与优化,提升模型性能与泛化能力。

2. 研究设计更优模型,包含不仅限于修改位置编码以及attention方式来支持更长上下文等。

3. 协同跨部门团队完成模型训练、调优及部署,确保技术方案高效落地。

4. 对自研大模型基座进行优化评测,发现模型与其他模型的优劣势,客观帮助自研模型迭代。

任职要求:

1. 硕士及以上学历,计算机、人工智能或相关专业毕业。

2. 3-5年大模型预训练算法经验,熟悉机器学习框架(Megatron-LM、Deepspeed等)。

3. 精通Python编程,熟悉Linux开发环境,具备算法工程化能力。

4. 善于学习,技术钻研。

公司地点:深圳南山区绿景美景广场B栋 1001

公司简介:

职位发布者:rick

成都智远通途人力资源服务有限公司

融资阶段:

公司规模:

相似职位: