1.负责行业大模型的开发工作,包括模型训练、调优和部署等方面代码开发工作;
2.负责行业大模型网络架构设计,设计预训练任务方案、指令微调方案、适配算法和调优工程方案;
3.负责大模型算法能力建设,开展大模型预训练、指令微调研发工作,提升大模型开发、交付效率与质量;
4.参与行业大模型应用需求设计、任务分解和技术规划。 1.硕士及以上学历,3年以上人工智能领域的相关工作经验,具备千亿量级大模型的预训练、微调经验者优先;
2.掌握大模型预训练、微调以及智能体编排、调度等方法,熟悉机器学习、深度学习和自然语言处理原理、算法和技术;
3.精通Python等编程语言,具备良好的编程能力和算法实现能力,熟悉Transformer等主流算法和网络结构;
4.熟悉Llama2、Baichuan、Qwen等主流大模型,具备语料清洗、知识召回、大模型调优、大模型推理加速等技术能力;
5.具有良好的团队协作精神,能够独立面对和解决复杂的技术挑战。