【岗位职责】
1. NLP大模型前沿探索,推动NLP大模型效果达到行业领先;
2. 解决法律类场景技术难点,研发多轮对话驱动的语音数字人系统,实现自然、拟人化的对话交互体验,解决大模型业务落地的技术障碍;
3. 协同跨团队技术和业务同学共同达成技术和业务目标。
=============================
【数据开发/工程研发岗的简历勿扰】
=============================
【职位要求】
1. 计算机/统计等相关专业获得硕士及以上学位, 发表过大模型相关研究AI顶会论文优先;
2. 掌握大模型技术栈,包括不限于模型推理的优化方法、微调技术、性能加速方法等;
3. 熟练掌握主流深度学习框架pytorch/tensorflow,大模型训练框架Megatron-LM/Deepspeed/Ray等多机多卡方案,有百亿/千亿大模型训练调优经验优先;
4. 熟悉常见的模型小型化技术,如量化/剪枝/蒸馏等,熟悉增量训练、微调训练等原理;
5. 熟悉强化学习,对奖励模型、PPO及衍生算法等有了解;
6. 具备百亿模型部署经验;
7. 有良好的代码开发能力,有开源项目开发经验优先。