岗位职责:
1、人工智能大模型的预训练、微调和推理;
2、处理、清洗和整合数据,分析训练结果;
3、排查和解决模型训练过程中的问题。
任职资格:
1、计算机、人工智能、自然语言处理或相关专业硕士及以上学历;
2、在大语言模型、自然语言处理、机器学习等领域有扎实的理论基础和研究经验;至少发表1篇CCF-A类会议或期刊的论文,如CVPR、NeurIPS、ACL等;
3、熟悉大语言模型相关的前沿技术研究和创新工作,包括但不限于instruction tuning、in-context learning和RAG等,对主流大模型如Llama、GLM、Qwen、InterLM等的原理和差异有深入理解;
4、熟悉PyTorch、TensorFlow等主流深度学习框架,具备优秀的编程和工程实现能力;
5、优秀的分析问题和解决问题的能力,善于创新和快速学习;
6、良好的团队合作精神和沟通能力,能够用英文流畅地进行交流。