工作内容:
1. 主导核心业务领域(用户、交易、商品、营销、流量等)的数据模型设计与开发,在数据仓库中构建分层清晰、可扩展、高性能的数据集市(Data Marts)。
2. 数据转化与建模: 使用SQL、Python及dbt等工具,开发、测试和维护数据处理流程,将原始数据转化为干净、可靠、文档化的分析就绪宽表。
3. 保障数据质量与口径: 建立关键数据的质量监控与告警机制,与业务方和分析师共同定义核心指标的计算口径并将其代码化、流程化,确保数据全链路的准确性与一致性。
4. 赋能分析与BI: 与数据分析师紧密协作,深刻理解其用数痛点和需求,为其提供稳定、易用的数据产品,并负责核心Tableau报表的数据源性能优化。
5. 推广数据资产: 撰写并维护清晰的数据字典、模型文档等技术文档,推广数据资产的使用方法。
任职要求:
经验背景: 本科及以上学历,计算机、软件工程、统计学等相关专业;3年以上数据仓库开发、ETL开发或BI工程师经验,有互联网/电商行业经验者优先。
硬技能/技术栈:
■ SQL: 精通SQL编写和优化能力,对窗口函数、CTE等高级技巧运用自如。
■ 数据建模: 深刻理解并能熟练应用维度建模理论,有从0到1设计数据集市的成功经验。
■ 工程化思维: 熟悉Python进行数据处理;熟练使用Git进行版本控制;有自动化测试和数据质量保障的意识和实践。
■ 大数据技术: 熟悉Hive/Spark等至少一种大数据计算引擎。
■ 核心加分项: 有dbt (Data Build Tool) 项目实战经验。
■ 加分项: 熟悉Airflow, DolphinScheduler等至少一种工作流调度工具。