大语言模型(LLM)工程师

岗位职责

1、参与大模型(LLM)训练数据合成、知识增强、数据效果验证等工作;

2、参与大模型算法研发与创新、模型结构效果验证、模型性能优化等工作;

3、参与大模型训练、基础模型效果评估与分析、模型训练策略优化等相关工作;

4、参与大模型后训练工作,提升大模型数理逻辑、代码、智能体以及通用问答能力;

5、对大模型领域最新研究成果进行跟踪和实践,并进行工程成果转化和创新成果发表;

任职要求

1、硕士及以上学历,计算机、电子信息、人工智能等相关专业;

2、实际参与过大模型结构设计、大模型预训练、大模型效果评估与分析、大模型性能调优等相关工作者优先;

3、了解开源大模型评测方法及评测榜单并可快速完成评测适配,有知名榜单比赛经验者优先;

4、代码能力强,能快速搭建开发环境编写代码完成模型效果验证,对微调训练、强化学习、推理加速等开源技术有实践经验;

5、具有良好的学习能力和自我驱动力;具有强烈的团队协作意识,高度的责任感,对工作积极严谨,逻辑思维能力强,有较强学习和创新能力。

6、具有基座模型预训练经验,大厂经验优先。

公司地点:北京中汇广场

公司简介:

职位发布者:Rita

上海荞麦管理咨询有限公司

融资阶段:

公司规模:20~99人

相似职位: