NLP大模型算法工程师

【岗位职责】

1、从事大语言模型 (LLM) 预训练算法研究、训练应用,涉及多语言、知识增强、模型性能提升等方面,以及大数据相关经验;

2、负责自然语言处理 (NLP) 方向基于GPU的并行多机多卡训练、高性能模型推理等;

3、协助业务完成大语言模型在行业的落地,建设数据收集、领域微调、业务反馈优化的应用解决方案,将先进的NLP生成技术应用于实际业务,获取业务收益,更好服务用户;

4、前沿技术跟进研究,支持公司通用类和垂类预训练模型研发及效果持续优化。

【岗位要求】

1、计算机、电子信息、数学等人工智能相关专业硕士及以上学历,具有两年以上NLP相关经验;

2、掌握机器学习、深度学习基本理论和常见模型,熟悉NLP常见任务和基本方法,熟悉Transformer模型和注意力机制,对 LLM 有深入理解和实践;

3、熟悉pytorch/tensorflow/Transformers库,熟练掌握GPT、T5等算法训练范式,有生成模型的finetune、RLHF的经验优先;

4、有NLP顶会论文、相关竞赛经历、以及大模型预训练经验的优先,党员优先;

5、具备良好的逻辑思维能力和问题解决能力,具备团队合作精神、沟通协作能力、自我学习能力。

公司地点:北京电子城·研发中心A110号楼8层

公司简介:

职位发布者:杨

北京汉勃科技有限公司

融资阶段:不需要融资

公司规模:100~499人

相似职位: