岗位职责:
1.负责多源异构数据的全生命周期管理,构建高精度、多模态的地球系统数据体系;
2.设计并优化面向地球系统的分布式数据架构与智能处理流水线,研发自动化标注与质量评估系统,提升数据利用效率与模型训练效果;
3.牵头数据平台的战略规划与技术攻关,开发多维度数据可视化与智能分析工具;
4.探索前沿技术在数据增强与合成中的应用,主导数据处理平台工具链设计,推动大模型训练与部署全流程数据支撑体系优化;
5.推动跨机构数据共享与协作,提升领域内数据生态影响力。
任职要求:
1.博士学历,计算机科学、数据科学相关学科背景,7年以上大数据治理或AI数据工程经验;
2.精通数据自动化标注技术体系,具备基于主动学习、半监督学习的标注算法研发经验;
3.深入掌握分布式数据处理技术,熟悉数据湖仓一体架构设计,有高并发数据平台开发经验;
4.熟悉遥感影像与多模态数据融合方法,具备深度学习框架应用经验,掌握主流数据格式与标准;
5.具有较强的科研组织与管理能力,能统筹技术路线规划并推动成果落地。