岗位职责:
1、模型开发与优化,负责大模型的训练过程,包括数据预处理、模型初始化、训练方案制定与实施,以及训练效率的优化。对已有的大模型进行调优,包括模型结构的改进、超参数调整、正则化技术应用等,以提升模型性能和泛化能力。
2、深入研究和探索最新的机器学习和深度学习算法,并将其应用于大模型的研发工作中。根据业务需求,将大模型技术转化为实际产品或解决方案,解决具体业务问题。
3、项目协同与技术支持,与产品经理、数据科学家、项目经理等跨部门团队成员紧密合作,共同完成产品需求分析、原型设计、上线部署等工作。
提供技术支持,协助解决模型应用过程中的各种技术问题。
4、基础设施建设与维护,参与或负责大模型训练所需的硬件设施选型与配置,以及分布式计算集群的搭建与维护。
5、文档撰写与知识传承,编写模型设计文档、技术报告、用户手册等,记录模型训练过程和技术细节。分享技术成果,推动团队内部的知识积累与传播。
任职要求:
1、本科及以上学历,计算机科学、人工智能、数学、统计学等相关专业本科及以上学历。
2、熟悉深度学习、机器学习、自然语言处理等相关领域的理论知识和实践经验。
3、具备大规模预训练模型(如GPT、BERT等)的训练和调优经验,能够熟练运用TensorFlow、PyTorch等深度学习框架。
4、掌握模型压缩、量化、加速等技术,以及模型服务化和工程化的实现能力。
5、优秀的编程能力,熟悉Python、Java、C++等至少一种编程语言。
6、良好的问题解决和创新能力,能够快速跟进和实现新的算法研究成果。
7、具备良好的团队协作精神和沟通能力,能够在复杂环境下推动项目的实施。
8、具有3年以上的相关工作经验。