岗位职责
1、参与大模型(LLM)训练数据合成、知识增强、数据效果验证等工作;
2、参与大模型算法研发与创新、模型结构效果验证、模型性能优化等工作;
3、参与大模型训练、基础模型效果评估与分析、模型训练策略优化等相关工作;
4、参与大模型后训练工作,提升大模型数理逻辑、代码、智能体以及通用问答能力;
5、对大模型领域最新研究成果进行跟踪和实践,并进行工程成果转化和创新成果发表;
任职要求
1、硕士及以上学历,计算机、电子信息、人工智能等相关专业;
2、实际参与过大模型结构设计、大模型预训练、大模型效果评估与分析、大模型性能调优等相关工作者优先;
3、了解开源大模型评测方法及评测榜单并可快速完成评测适配,有知名榜单比赛经验者优先;
4、代码能力强,能快速搭建开发环境编写代码完成模型效果验证,对微调训练、强化学习、推理加速等开源技术有实践经验;
5、具有良好的学习能力和自我驱动力;具有强烈的团队协作意识,高度的责任感,对工作积极严谨,逻辑思维能力强,有较强学习和创新能力。
6、具有基座模型预训练经验,大厂经验优先。