岗位职责
1.推进大模型在各个业务场景落地,包括不限于智能客服、自动翻译、图像识别、路径优化、智能搜索等;
2.构建大模型算法技术体系,包括模型架构、LLM大模型预训练方法、高效微调、模型评估及迭代等,在业务场景中不断优化大模型效果;
3.与产品和业务团队紧密合作,根据业务场景的需求,快速迭代和开发AI应用程序,解决业务上的痛点和挑战,实现卓越的用户体验;
4.撰写技术⽂档,记录和分享研究成果,进行跨团队协同最终输出业务价值;
岗位要求
1. 本科以上学历,3年以上算法领域工作经验,大模型相关研究和落地的实践经验;
2. 熟悉Transformer、BERT、GPT系列等模型基本原理,对大模型数据处理及训练技术有深入理解
3. 熟悉Pytorch/Tensorflow深度学习框架,熟练使用Python;
4. 有搜索、推荐领域相关落地经验优先
5. 出色的分析问题和解决问题能力,能深入解决大模型训练和应用中存在的问题;
6. 良好的沟通协作能力,能和团队一起探索新技术,推进技术进步;