工作职责:
0)智能问答开发,以及知识工程开发。
1)熟悉银行业务知识,精通自然语言处理技术、大模型技术、知识库技术等数据产品相关的理论及方法。
2)开发和优化基于LLM的应用解决方案,满足客户需求。
3) 制定并实施应用场景的解决方案,负责方案的优化和持续改进。
4)深入学习并运用提示词、RAG、微调、function call等AI应用开发技术,优化产品技术深度。
5)设计、开发和优化大规模语言模型(LLM),如GPT类模型、BERT等
6)研究和实现最新的大模型训练技术,包括预训练、微调和推理优化
7)探索大模型在各种下游任务中的应用,如问答、摘要、对话系统等
8)与数据团队合作,设计和实施大规模数据处理和预处理流程
任职要求:
1. 计算机科学、人工智能或相关领域的学士学位
2.3年以上java经验,2年以上深度学习研究经验,特别是在大规模语言模型方面
3.熟练使用Python.java编程语言。
4.对LLM的应用开发有深入理解,具备灵活运用LLM技术的能力,理解大模型相关技术原理,了解基本实现方式如function call、Rag、Agent等。
5. 对RAG、微调、function call等AI应用开发技术至少在一项有深入了解。
6. 熟悉PyTorch或TensorFlow等深度学习框架
4. 熟悉Transformer架构及其变体,如GPT、BERT、T5等
5. 深入理解自然语言处理(NLP)技术和最新进展
6. 熟悉模型压缩和优化技术,如量化、知识蒸馏等
7. 具有解决复杂技术问题的能力和创新思维
8. 良好的英语读写能力,能够阅读和理解最新的研究论文