大模型算法专家

岗位职责

1. 参与大型语言模型的训练与效果优化,包括但不限于数据处理、预训练、指令精调、RLHF等。

2. 对现有算法、数据进行分析和评估,优化模型生成效果,减少有害、敏感或偏见相关回复。

3. 调研并探索LLM方向前沿算法、框架,持续提升现有算法的效率与效果。

岗位基本需求

1. 对大模型有技术热情,熟悉GPT/BERT/T5等模型的原理;

2. 熟悉Python,熟练使用TensorFlow/PyTorch/Megatron/Triton等深度学习训练或推理框架,熟悉java/C++中的一种。

具备以下者优先

1. 有SIGIR、ACL、WWW等NLP/搜索领域顶会论文发表经验;

2. 有KDDCup、RecSys、Kaggle、天池等机器学习比赛获奖经验;

3. 在GLUE/TREC/TAC/SemEval等NLP/IR权威评测中取得优秀名次

公司地点:北京望京北路望京北路1号

公司简介:

职位发布者:谢国锋

东莞市三方人才咨询有限公司

融资阶段:

公司规模:100~499人

相似职位: