岗位职责:
1、数据基础设施建设:
负责构建和优化支持自动驾驶端到端大模型训练、评估和部署的数据基础设施,包括数据采集、传输、存储、分发和管理系统。
2、大规模数据处理与管理:
设计并实现PB级自动驾驶数据的高效处理流程,支持数据清洗、标注、索引、版本管理和回溯机制,保障数据全生命周期的高可用与可追溯性。
3、训练数据链路搭建:
与算法、训练平台团队紧密合作,构建模型训练所需数据流通链路,实现多模态(图像、点云、语义、传感器等)数据的结构化与高效供给。
4、数据闭环系统开发:
自动驾驶数据闭环系统的设计与实现,包括自动采样、错误案例挖掘、重标注、数据增强和回流机制,提高模型训练效率与效果。
5、数据平台与工具链开发:
开发与维护面向内部用户的数据平台、可视化管理系统和调度工具,提升研发团队的数据使用效率。
任职要求:
1、学历与专业
本科及以上学历,计算机科学、数学、统计学、自动化、车辆工程等相关专业。
2、专业经验
-具备数据系统经验者优先:3年以上大数据基础设施相关经验,有自动驾驶、AI大模型、智能驾驶或云平台方向的项目背景优先;熟悉大规模数据处理框架。
-具备存储与计算优化能力者优秀:熟悉分布式文件系统与数据库系统,具备调优分布式计算/存储系统性能的实践经验。
3、编程能力
-熟练掌握 Python、Java、Scala 或 Go 中至少一种,有良好的工程化能力和代码规范意识。
-熟悉数据处理和分析工具,如NumPy、Pandas、Matplotlib等。
4、系统架构能力(专家需要)
-能独立设计和实施高可用、高并发、高性能的数据基础设施架构;
-熟悉Kubernetes、Docker等容器化技术,有相关部署和调度经验优先。
5、协作与推动能力:
-具备良好的跨团队沟通与项目管理能力,能够协同算法、模型、训练和平台团队高效推进系统建设与演进。