数据开发工程师/专家-杭州/北京(ETL&建模

岗位描述

1、数据ETL

• 基于业务需求进行数据可用性调研和可行性分析

• 从各种来源中收集数据,并进行数据清洗、转换和存储

• 为业务方数据产品提供可规模化复制、稳定、高质量、高效的数据资产

2、数据分析与建模

• 通过数据探索和分析,发现数据特征、潜在规律及关联性

• 开发数据工具和算法,设计端到端的数据流架构,建立数据模型,并基于业务反馈进行模型评估和优化

3、数据可视化

• 将数据分析结果以可视化的形式展示出来,并根据需求制作数据报告

4、数据工程实现

• 提供数据采集、融合、加工处理、多源大规模数据流等场景的研发和工程实现

• 为算法、数据应用、业务提供持稳定、高质量、高效的数据基础设施、数据应用和数据资产

5、数据安全合规

• 负责数据安全合规与流通、数据质量、数据成本、个人隐私保护、数据治理、规范制定、元数据管理等数据管控工作

岗位要求

1、2年以上数据仓库领域经验,熟悉数据仓库模型设计与ETL开发经验 ,掌握Kimball的维度建模设计方法,具备海量数据加工处理(ETL)相关经验,能灵活运用SQL

2、熟悉数据仓库领域知识和技能者优先,包括但不局限于:主数据管理、元数据管理、数据开发测试工具与方法、数据质量

3、有从事分布式数据存储与计算平台应用开发经验,有Hadoop、Spark、Spark Streaming、Storm、Flink 等离线计算、实时计算数据研发经验,有实时流数据开发经验者优先

4、熟练掌握一门或多门编程语言,并有大型项目建设经验者优先,重点考察Java、Python,具有UDF/UDTF/UDAF开发经验,有数据挖掘经验者优先考虑

5、责任心强,做事细致,具备良好的语言沟通与表达能力、团队协作能力和自我驱动动力

公司地点:杭州西湖区阿里巴巴云谷园区1号楼

公司简介:

阿里云——为了无法计算的价值

阿里云计算有限公司成立于2009年9月10日,在杭州、北京和硅谷等地设有研发中心和运营机构。阿里云的目标是打造全球领先的云计算服务平台。在未来的互联网中,云计算将会成为一种随时、随地,并根据需要而提供的公共服务。高效的绿色数据中心以及能支持不同互联网应用的大规模分布式存储和计算是营造下一代互联网服务平台最基本的核心技术。

阿里云致力于打造公共、开放的云计算服务平台。阿里云将借助技术的创新,不断提升计算能力与规模效益,将云计算变成真正意义上的公共服务。与此同时,将通过 alibabacloud.com,用互联网的方式使得大家可以便捷的按需获取阿里云的云计算产品与服务。 阿里云希望更多的合作伙伴、中小企业、开发者能够受益于云计算带来的便利和价值,从而促进云生态系统的健康发展。

至2017年,阿里云付费用户数651,000+,用户总数2,300,000+。

关于云栖大会:由阿里巴巴集团主办,已经成为全球云计算TOP级峰会,汇聚DT时代最强大脑,描绘云计算发展趋势和蓝图,展现云计算、大数据、人工智能蓬勃发展的技术生态全景。2017云栖大会城市峰会将继续在深圳、南京、成都、上海、广州、苏州、北京举办。杭州云栖大会将于10月继续在中国杭州云栖小镇举办,打造年度最精彩的云计算盛会。

职位发布者:侯女士

阿里云计算有限公司

融资阶段:

公司规模:1000~9999人

相似职位: