岗位职责
1. 全链路技术规划与架构设计 :主导数据闭环全流程(采集上云→解析挖掘→清洗标注→数据治理)的技术架构;设计统一多模态数据湖,实现冷热数据智能分级与存储成本优化。
2. 平台与工具链开发:推动数据平台、生产平台、车队管理平台、标注生产工具链的技术规划与迭代; 支持高并发、高可靠的数据采集与上云系统,构建自动化数据解析、挖掘与自动化清洗平台,提升数据价值密度;支持多模态数据的规模化精准标注。
3. 数据治理与效能突破 :建立数据版本管理、血缘追踪、质量监控体系,确保全链路可追溯性与合规性;通过流程自动化显著降低数据闭环成本与周期;构建细粒度权限控制系统,实现权限变更实时生效。
4. 跨团队协同与技术赋能:与算法、车端、云端团队协作定义数据供给标准,培养技术团队,建立开发规范与知识沉淀机制。
任职要求
1. 基础要求: 需具备计算机、软件工程或自动化等相关专业本科及以上学历,拥有8年以上大数据平台或工具链开发经验,且需主导过至少一个完整的自动驾驶数据闭环平台项目,覆盖数据采集、标注、治理全流程。
2. 核心技术能力: 精通数据闭环全链路技术栈,包括采集、处理、标注(2D/3D工具开发、自动化质检、众包集成)、治理;具备在AWS/Azure/GCP等云平台设计PB级数据系统的云原生架构能力;掌握多模态数据处理技术,如点云压缩、时空同步和异构数据管理。
3. 业务落地能力: 拥有冷数据存储成本优化的成功实践经验;具备设计字段级RBAC权限系统的能力;能应用自动化技术(如LLM、预标注)有效降低数据生产运营成本。
4. 关键软实力: 具备极强的系统架构能力,能有效权衡性能、扩展性、成本与效率;深入理解自动驾驶领域的数据痛点
5. 优先考虑项: 具备大规模实车数据平台(千台级车队、PB级数据)运维经验;熟悉自动驾驶相关合规规范(如GDPR、国标)并主导过敏感数据脱敏方案;