职位描述:
1、负责设计和实现基于 RAG (Retrieval-Augmented Generation) 的核心应用架构。
2、主导技术选型,包括向量数据库、大语言模型、检索算法和微调策略。
独立完成关键技术模块的攻关、原型验证和性能优化 (如提高检索准确率、降低幻觉、优化响应速度和成本)。
3、带领一个2-4人的小团队,完成从需求到技术交付的全过程,确保项目质量和进度。
4、编写高质量的工程代码和技术文档,沉淀团队的最佳实践。
任职要求:
1、精通 Python,具备扎实的软件工程功底(代码结构、设计模式、测试、CI/CD)。
2、有大规模、高并发系统设计或开发经验者优先。
3、深入理解 RAG 工作原理,熟悉从文本切分(Chunking)、向量化(Embedding)到检索(Retrieval)和生成(Generation)的全链路。
4、有实际使用 LangChain、LlamaIndex 或类似框架的复杂项目经验。
5、熟悉至少一种向量数据库(如 Milvus, Pinecone, Weaviate, Qdrant 等)的实践和调优。
6、有丰富的 OpenAI, Anthropic, 或开源大模型 (如 Llama, Mistral) 的 API 调用和集成经验。
7、具备技术攻坚的毅力和解决复杂问题的能力。
8、良好的沟通能力,能将复杂技术问题向非技术人员讲清楚。
9、有带领小团队或作为项目核心成员的成功经验。