职位描述
1、负责大模型研发的全流程工作,包括但不限于数据、训练、评测、推理部署;
2、LLM算法应用研究与算法落地工作,包括但不限于语言LLM、多模态LLM,Prompt工程/RAG/Agents/SFT/RLHF等LLM相关前沿技术;
3、持续探索在各种用户场景下,利用AI能力增强业务迭代效果;
4、深度参与产品研发项目,和产品经理/业务研发同学密切配合,提高项目整体收益。
职位要求
1、计算机相关专业本科及以上学历,深度学习算法研究与开发经验,具有LLM开发和实际落地经验;
2、具备LLM相关算法的扎实基础,包括但不限于单模态/多模态LLM训练、部署等方面的学习和实践经验;
3、熟悉主流的Transformer架构下主流模型,熟练掌握PyTorch/TensorFlow等主流机器学习框架;
4、有较强的业务问题到算法模型的建模能力,有强烈的技术好奇心、自驱力和进取心,能及时关注和学习业界最佳实践。
加分项:
1、有高关注度的GitHub项目;
2、有过数据挖掘/机器学习或ACM-ICPC/NOI/IOI相关的竞赛经历并取得优秀成绩;
3、有国际顶级会议(KDD/NeurIPS/ACL/EMNLP/IJCAI/AAAI/SIGIR等)Paper发表者优先。