岗位职责:
1、负责基于AI大模型(如LLM、NLP、CV等)的AI智能体平台架构设计,包括技术方案选型、模型部署&参数调优、API封装、故障排查、性能优化等;
2、参与满足公司业务需求的Al智能体或工作流的设计和落地,确保高吞吐、低延迟、高准确率及稳定运行;
3、涵盖机器学习系统等多个方向的工作,包括:模型训练、模型推理、资源调度、任务调度、模型管理、工作流编排等;
4、熟悉大模型部署,负责多种异构资源如GPU、CPU等的最优化的编排调度,提升集群的整体资源利用率;
5、负责指导赋能提升团队整体AI应用技术水平;
岗位要求:
1、本科及以上学历,计算机、人工智能、数学、软件工程等相关专业;
2、5年以上后端开发经验,精通Spring Boot、熟悉构建云原生应用工具(Kubernetes,Docker等)及部署;
3、3年以上AI相关经验,熟悉主流NLP/LLM开发平台(如Dify、LangChain)、深度学习框架(如TensorFlow/PyTorch)或计算机视觉(OpenCV);
4、具备扎实的代码功底和平台化架构设计能力,熟悉Java/Python/TypeScript/等编程语言,熟悉常用的AI开发框架和技术组件;
5、创新能力和创新意识比较强,对于不断探索新的AI技术和应用场景有强烈意愿和主观能动性,能紧跟AI领域的最新发展动态,不断提升自己的专业知识和技能;
6、有AI应用项目的相关经历,熟悉LLM应用架构,PE工程化和数据评测等,对于Agent,RAG,LangChain、Embedding等有深刻的认知和理解;
7、有智能客服、问答机机器人和RAG开发、大模型分布式私有化部署经验优先;