主要职责:
1. 多模态LLM Agent开发:
基于多模态大型语言模型(如GPT-4V, Gemini等)进行AI Agent的构建、训练、微调和优化,使其能够处理图像、文本、音频等多种模态信息。
根据业务需求,设计并实现复杂的AI Agent逻辑,包括对话管理、任务规划、工具调用等。
研究和探索最新的多模态LLM技术,并将其应用于实际业务场景。
2. 模型优化与部署:
对已训练的模型进行性能评估、调优,确保其在实际应用中具有高准确率、高效率和高稳定性。
参与模型部署流程,包括容器化、API封装、模型推理加速等,保证模型能够快速、稳定地服务于线上业务。
3. 数据处理与分析:
参与数据清洗、预处理、标注等工作,为模型训练提供高质量的数据支持。
4. 对模型运行结果进行分析,定位问题,并提出优化方案。
5. 技术文档编写:
撰写清晰、准确的技术文档,包括模型设计、训练过程、部署流程等,确保团队成员之间的良好沟通和协作。
6. 团队合作:
与产品经理、前端工程师等跨部门团队紧密合作,共同推动项目落地。
积极参与技术分享和团队学习,不断提升自身技术水平。
任职要求:
1. 计算机科学、人工智能、软件工程或相关专业本科及以上学历。
2. 2年以上机器学习/深度学习算法开发经验,有LLM项目经验者优先。
3.扎实的机器学习/深度学习理论基础,熟悉常见的模型(如Transformer, CNN, RNN等)和优化算法,熟悉至少一种深度学习框架(如TensorFlow, PyTorch)。
4.熟悉多模态LLM(如GPT-4V, Gemini, LLaVA等)及其应用,有实际的Agent开发经验者优先。
5.熟练掌握Python编程语言,具有良好的代码风格和工程实践能力;熟悉数据处理、清洗和分析的常用工具和方法,了解模型部署相关的技术,如Docker、Kubernetes、API等。