大模型算法工程师

岗位职责：

1、模型开发与优化，负责大模型的训练过程，包括数据预处理、模型初始化、训练方案制定与实施，以及训练效率的优化。对已有的大模型进行调优，包括模型结构的改进、超参数调整、正则化技术应用等，以提升模型性能和泛化能力。

2、深入研究和探索最新的机器学习和深度学习算法，并将其应用于大模型的研发工作中。根据业务需求，将大模型技术转化为实际产品或解决方案，解决具体业务问题。

3、项目协同与技术支持，与产品经理、数据科学家、项目经理等跨部门团队成员紧密合作，共同完成产品需求分析、原型设计、上线部署等工作。

提供技术支持，协助解决模型应用过程中的各种技术问题。

4、基础设施建设与维护，参与或负责大模型训练所需的硬件设施选型与配置，以及分布式计算集群的搭建与维护。

5、文档撰写与知识传承，编写模型设计文档、技术报告、用户手册等，记录模型训练过程和技术细节。分享技术成果，推动团队内部的知识积累与传播。

任职要求：

1、本科及以上学历，计算机科学、人工智能、数学、统计学等相关专业本科及以上学历。

2、熟悉深度学习、机器学习、自然语言处理等相关领域的理论知识和实践经验。

3、具备大规模预训练模型（如GPT、BERT等）的训练和调优经验，能够熟练运用TensorFlow、PyTorch等深度学习框架。

4、掌握模型压缩、量化、加速等技术，以及模型服务化和工程化的实现能力。

5、优秀的编程能力，熟悉Python、Java、C++等至少一种编程语言。

6、良好的问题解决和创新能力，能够快速跟进和实现新的算法研究成果。

7、具备良好的团队协作精神和沟通能力，能够在复杂环境下推动项目的实施。

8、具有3年以上的相关工作经验。

公司地点：合肥天源迪科科技园-1号楼合肥蜀山区天源迪科科技园1号楼16楼