岗位职责:
1、设计和开发类GPT大规模语言模型,包括模型的训练、优化和评估等方面;
2、研究最新的自然语言处理\多模态大模型\强化学习等算法,并将其应用到我们的平台中,提高平台的性能和稳定性;
3、参与开发模型在各种应用场景中的应用,包括对话系统、阅读理解、文档润色、闲聊对话等方面;
4、负责算法的性能测试和调优,保证算法的准确性和效率;
5、与团队合作,不断改进和优化算法,推动平台技术的发展。
任职要求:
1、计算机、通信、自动化、数学或相关专业的硕士及以上学位,博士优先;
2、有大规模语言模型数据设计和模型训练调优经验,熟悉transformer/bert/gpt原理,有gpt应用经验优先;
3、5年以上自然语言处理/多模态大模型/强化学习等算法研究或开发经验;
4、熟练掌握至少一种深度学习框架,如PyTorch、TensorFlow等;
5、熟练使用Python、C++等编程语言;
6、具备良好的数学、统计学和算法分析基础;
7、具有优秀的沟通和团队合作能力;
8、有NLP/DL/多模态顶级期刊/会议论文发表经历者优先。