Responsibilities:
1 架构并开发检索增强生成 (RAG) 流程,集成外部 LLM API(OpenAI、Anthropic、Mistral 等)
2 设计和维护向量数据库(Pinecone、Weaviate、Redis 或类似数据库)
3、开发用于品牌的上下文注入和动态提示组装
4、 与前端、DevOps 和产品团队协作,监控 AI 推理工作负载的性能、延迟和成本,随时了解 LLM 生态系统中的新兴工具
Requirements:
1、3 年以上 AI/ML 或后端软件工程经验
2、精通 Python 和现代 AI 框架(LangChain、LlamaIndex 等)
3、向量数据库和嵌入的实践经验
4、熟悉 OpenAI、DeepSeek、Anthropic、Claude 和 Cohere API
5、了解提示词工程、Token限制和上下文窗口管理
加分项:拥有多租户 SaaS 或内容平台经验