大数据架构师

职位名称

资深数据开发工程师/大数据架构师

职位概述

我们正在寻找一位技术扎实的资深数据开发专家,负责构建和维护企业级数据平台的核心数据处理体系。您将主导大规模数据管道的设计开发,优化数据处理流程,确保数据的高效、准确流转,为业务决策和数据分析提供可靠支撑。

核心职责

1. 数据体系建设

设计并实现高效可靠的数据ETL/ELT流程

开发和维护数据仓库各层(ODS/DWD/DWS/ADS)数据处理逻辑

构建实时数据管道,支持流批一体数据处理

2. 数据处理开发

编写高质量SQL和分布式计算程序(Spark/Flink)

优化数据处理作业性能,降低资源消耗

解决海量数据场景下的计算和存储挑战

3. 数据质量保障

设计和实施数据质量监控体系

开发数据校验和异常处理机制

建立数据血缘追踪和影响分析能力

4. 技术方案落地

参与数据技术选型和架构设计

负责医疗行业大数据平台的规划、设计与落地,包括数据采集、存储、处理、分析及可视化全流程架构。

设计高可用、可扩展、安全的分布式系统,支持PB级医疗数据(如电子病历、影像数据、基因组数据、IoT设备数据等)的高效处理。

结合医疗行业特性(如HIPAA、GDPR等合规要求),设计符合隐私保护和数据安全的架构方案。

推动数据开发规范和最佳实践

指导初级工程师,提升团队整体能力

任职要求

技术能力

精通SQL和至少一种编程语言(Python/Java/Scala)

精通大数据生态技术(Hadoop/Spark/Flink/Kafka/Hive等),熟悉流批一体架构。

熟悉数据仓库建模和维度建模理论

掌握Linux环境和Shell脚本编写

了解常见数据库和存储技术(MySQL/HBase/Kudu)

行业经验

5年以上大数据架构经验,3年以上医疗健康领域相关项目经验。

熟悉医疗业务场景(如临床决策支持、真实世界研究、医保风控、药物研发等)。

主导过PB级数据处理项目

有完整的数据仓库建设经验

处理过复杂业务场景下的数据问题

加分项

熟悉云原生数据服务(EMR/Databricks)

了解数据湖技术(Delta Lake/Iceberg/paimon)

有数据治理相关经验

参与过开源项目贡献

公司地点:上海闵行区国民健康虹梅南路777号

公司简介:

职位发布者:宋先生

上海国民集团健康科技有限公司

融资阶段:

公司规模:

相似职位: