岗位职责:
1. 负责大模型预训练算法的设计与优化,提升模型性能与泛化能力。
2. 研究设计更优模型,包含不仅限于修改位置编码以及attention方式来支持更长上下文等。
3. 协同跨部门团队完成模型训练、调优及部署,确保技术方案高效落地。
4. 对自研大模型基座进行优化评测,发现模型与其他模型的优劣势,客观帮助自研模型迭代。
任职要求:
1. 硕士及以上学历,计算机、人工智能或相关专业毕业。
2. 3-5年大模型预训练算法经验,熟悉机器学习框架(Megatron-LM、Deepspeed等)。
3. 精通Python编程,熟悉Linux开发环境,具备算法工程化能力。
4. 善于学习,技术钻研。