岗位职责:
1、负责离线和实时数仓规划和建设,结合数据、技术与应用等多方特性,构建高可用、易扩展的数仓体系,高效满足业务用数诉求;
2、独立完成大数据产品迭代, 包括但不限于数据的实时采集,数据建模,数据治理,运营分析,用户画像,ABTest, 搜索推荐等产品的工程落地,以及数据平台/数据产品的开发,包括代码编写、单元测试、集成测试、静态检查、本地构建、测试环境搭建、问题定位等 ;
3、负责建立数仓与数据质量标准和规范,确定数据治理方案,并与内外部团队协作,推动落地实施,不断提升数据质量,确保数据及时、准确与稳定性;
4、不断优化数仓模型,抽象总结并沉淀通用方案与平台工具能力,提升研发与用户用数效率。
岗位要求:
1、本科以上学历,具有5年及以上大数据研发经验,包括实时/离线数据处理、数据建模、ETL开发与设计、数据治理等,有数据分析、指标体系构建工作经验优先;
2、熟练掌握HiveSQL、Python、Java等至少两种语言和工具,要求有实战经验;
3、掌握大数据相关技术,比如Iceberg、Spark、Flink、Hadoop、Hive的原理了解,要求有实战;
4、熟悉一门ClickHouse、Doris等OLAP引擎,了解系统原理,要求有实战经验;
5、对数据敏感,工作细致负责,具备良好的问题分析与解决能力;
6、具备较强的自我驱动力,有良好的团队合作精神和沟通能力,能适应快节奏的工作环境。