职位名称:数据科学家(LLM+RAG方向)
扁平化管理,可居家办公
职位描述:
我们正在打造一套融合了大语言模型(LLM,LargeLanguageModel)与检索增强生成(RAG,Retrieval-AugmentedGeneration)的创新系统,旨在为海量数据提供高效、精准的内容搜索与生成服务。为此,我们诚招一位既具备深厚数据库知识,又对推荐算法及前沿人工智能技术有深入了解的数据科学家加入我们的团队。
岗位职责:
1. 数据存储与数据库设计
• 根据业务需求与RAG框架,评估并决定需要存储的数据类型、结构及格式。
• 负责数据库的整体架构设计与优化,确保在高并发与海量数据场景下具备良好的性能与可扩展性。
• 参与并推动向新型数据库或分布式数据库(如向量数据库、NoSQL等)的技术选型及落地。
2. 数据库优化
• 根据实际场景进行分库分表、索引、缓存、分片等技术实施,最大化系统效率与稳定性。
• 对数据库进行性能监控与调优,解决数据库瓶颈与潜在风险。
• 规范团队数据库开发流程,支持DevOps/MLOps数据管线的持续迭代。
3. 数据管理与质量控制
• 制定数据存储、数据安全以及数据生命周期管理方案,平衡成本与效率。
• 负责关键数据的清洗、处理与一致性校验,保证数据的可靠性与准确性。
4. 推荐算法与模型研发
• 负责智能推荐算法的研究与实现,如协同过滤、深度学习、图神经网络等;与LLM+RAG框架相结合,提升系统的智能化。
• 追踪行业和学术界前沿算法,并与团队一起将合适的技术落地到实际产品中。
5. 与团队协作
• 与产品、算法工程师、后端开发等跨团队紧密合作,统筹系统需求与技术实现。
• 分享与交流数据分析、机器学习与数据库优化方面的最佳实践,提升团队整体技术水平。
任职要求:
1. 教育背景与经验
• 计算机、数据科学、软件工程、信息管理或相关专业本科及以上学历,硕士/博士优先。
• 3年以上数据相关工作经验,在数据库系统设计与优化方面有成熟的实战经验。
2. 数据库与数据存储
• 熟悉常见关系型数据库(如MySQL、PostgreSQL)与非关系型数据库(如MongoDB、Redis),有分布式数据库或向量数据库(如Milvus、Pinecone、Faiss等)实践经验者优先。
• 对数据库的索引机制、缓存策略、分区分片、读写分离、数据备份和安全管理有丰富经验。
3. 算法与模型
• 熟悉常用的机器学习或深度学习算法,尤其是推荐系统相关算法原理及实现。
• 对NLP、LLM等领域的新技术有一定了解,有RAG或大语言模型落地项目经验者优先。
4. 编程与工具
• 精通Python/Java/Scala等至少一种主流编程语言,熟悉Shell或其他脚本语言者优先。
• 熟悉常见数据分析和可视化工具(如Pandas、SQL、Tableau等)与主流机器学习框架(如TensorFlow、PyTorch、Scikit-learn等)。
5. 综合能力
• 良好的工程意识和大型系统设计能力,能够独立定位与分析系统性能瓶颈。
• 思维缜密,逻辑清晰,善于沟通与团队合作。
• 对前沿技术保持敏感度,热爱学习和分享。
加分项:
• 有构建或维护大规模数据仓库、数据湖或混合云数据平台的经验。
• 有MLOps体系建设经验,能推动CI/CD与数据处理流水线自动化。
• 具备数据治理、数据合规等相关项目经验。
我们提供:
• 面向前沿技术的工作机会,参与从0到1的LLM+RAG系统建设。
• 有竞争力的薪资与成长空间,支持技术探索与创新。
• 开放、有活力的团队文化,提倡分享与持续学习。
如您对本职位感兴趣,欢迎投递简历并随时与我们联系!
期待与您一起开启数据驱动的智能时代新篇章。