【数据标注工具链开发&数据运营方向在招】
1. 数据采集与质量管控:
- 设计并实施面向具身机器人的多模态数据采集方案,覆盖 传感器数据(摄像头、激光雷达、关节数据)、交互行为数据及环境语义信息。
- 制定 数据质量评估体系(如标注准确率、场景覆盖率、分布均衡性),通过自动化校验(规则引擎、异常检测)和人工抽样审核保障数据有效性。
- 与算法团队深度协作,将模型需求(如长尾场景挖掘、多模态对齐)转化为可执行的采集策略(如场景布置、合成数据生成)。
2. 数据链路开发与优化:构建高效的数据流水线,支持大规模数据存储、传输和实时处理。
3. 数据标注与增强:与标注团队合作,制定数据标注规范,确保标注一致性。
4. 支持算法研发:为具身智能算法团队提供高质量数据集,支持强化学习、模仿学习、感知与控制等方向的研究。
5. 跨团队协作:与硬件团队、软件团队及算法团队紧密合作,确保数据流与系统架构无缝集成。
职位描述
【学历】
计算机科学、软件工程、数据科学或相关专业本科及以上学历。
【技术技能】
1. 熟悉大数据处理技术及工具(如 Hadoop、Spark 等)。
2. 了解数据仓库设计和 Schema 设计。
3. 熟悉 Linux 环境,有一定的系统运维和脚本开发经验。
【经验与能力】
1. 2年以上自动驾驶或具身智能行业数据相关工作经验。
2. 有数据质量管理、监控和故障排查的能力。
3. 对分布式系统、数据并行处理和性能优化有深刻理解。
4. 沟通协作能力:能够与跨部门团队高效沟通,具备独立思考能力,能够解决复杂的技术问题。
【加分项】
数据安全和合规相关的项目经验。