岗位职责
1. 参与大型语言模型的训练与效果优化,包括但不限于数据处理、预训练、指令精调、RLHF等。
2. 对现有算法、数据进行分析和评估,优化模型生成效果,减少有害、敏感或偏见相关回复。
3. 调研并探索LLM方向前沿算法、框架,持续提升现有算法的效率与效果。
岗位基本需求
1. 对大模型有技术热情,熟悉GPT/BERT/T5等模型的原理;
2. 熟悉Python,熟练使用TensorFlow/PyTorch/Megatron/Triton等深度学习训练或推理框架,熟悉java/C++中的一种。
具备以下者优先
1. 有SIGIR、ACL、WWW等NLP/搜索领域顶会论文发表经验;
2. 有KDDCup、RecSys、Kaggle、天池等机器学习比赛获奖经验;
3. 在GLUE/TREC/TAC/SemEval等NLP/IR权威评测中取得优秀名次