职责:
构建统一、清晰、可复用的数据模型与指标体系;
打造符合数据架构要求的AI数据集,为大模型训练/微调提供高质量数据集;
负责数据质量管理与提升;
负责多源异构数据集的元数据注册管理。
能力要求:
具有数据标准的制定经验,能够与业务有效沟通,推动落地;
熟悉数据质量标准的定义与自动化,熟悉AI数据集的质量要求;
具备海量结构化数据和非结构化数据管理经验;
熟悉元数据管理体系和知识管理体系。