大模型预训练算法岗位

岗位职责：

1. 负责大模型预训练算法的设计与优化，提升模型性能与泛化能力。

2. 研究设计更优模型，包含不仅限于修改位置编码以及attention方式来支持更长上下文等。

3. 协同跨部门团队完成模型训练、调优及部署，确保技术方案高效落地。

4. 对自研大模型基座进行优化评测，发现模型与其他模型的优劣势，客观帮助自研模型迭代。

任职要求：

1. 硕士及以上学历，计算机、人工智能或相关专业毕业。

2. 3-5年大模型预训练算法经验，熟悉机器学习框架（Megatron-LM、Deepspeed等）。

3. 精通Python编程，熟悉Linux开发环境，具备算法工程化能力。

4. 善于学习，技术钻研。

公司地点：深圳南山区绿景美景广场B栋 1001