1. 参与项目的需求分析、数据流程设计、并完成相应设计文档的编写;
2. 深入理解数据业务,负责业务模型抽象、数据模型的设计开发,特征提取、分析和挖掘工作;
3. 参与数据仓库建设,负责数据仓库模型设计,开发高质量可扩展的底层数据仓库体系;
4. 参与数据仓库模型的ETL实施,ETL性能优化、技术攻关等。
任职要求:
1. 知名院校统招本科或以上学历,计算机、应用数学等相关专业,5年以上大数据和数据仓库相关工作经验,具有金融信息、企业图谱、商业大数据领域数据治理经验者优先考虑;
2. 精通数据仓库理论体系,对分层设计、维度建模等有深刻的认识和实战经验,熟悉不同建模方法的优劣;
3. 积极主动贴近业务,有良好的沟通协调能力,数据敏感度高,能够快速理解业务模型及数据模型;熟练掌握SQL/HQL/Spark SQL开发及优化技能,快速ETL实施能力;
4. 熟悉大数据生态技术栈,具备较丰富的Hadoop,Hive,Spark,Flink等大数据工具应用和开发经验;
5. 能数量使用Python语言,熟悉DolphinScheduler、DATAX、KETTLE等工具的使用。