职位描述 :
1、本科毕业3年以上,计算机、人工智能、数学、统计学或相关专业以上学历;
2、熟悉主流大模型架构(如Transformer、MoE),了解模型训练、调优及微调方法(如LoRA、Prefix-tuning);
3、熟悉python等编程语言;
4、大规模数据处理经验,掌握数据清洗、标注、增强等全流程;
5、对金融等垂直领域有技术理解或项目经验优先;
6、优秀的逻辑思维能力,能独立设计并推动复杂项目落地;
7、良好的沟通能力和团队协作意识,能在跨部门场景中提供技术解决方案;
8、加分:实际大型模型部署经验、熟悉检索增强生成(RAG)、强化学习(RLHF)、联邦学习等大模型相关技术。
工作职责:
1、设计高效微调(Fine-tuning)方案,解决特定场景的问题;
2、主导或参与业务大模型场景需求落地开发工作,包括需求沟通、分析、数据收集、标注等工作;
3、搭建高可用MCP服务,支持高并发、低延迟API服务;
4、针对业务需求定制Prompt工程流程,设计Few-shot/Zero-shot学习方案;
5、探索大模型与多模态(图像、音频)的融合应用,构建端到端解决方案