职位名称
资深数据开发工程师/大数据架构师
职位概述
我们正在寻找一位技术扎实的资深数据开发专家,负责构建和维护企业级数据平台的核心数据处理体系。您将主导大规模数据管道的设计开发,优化数据处理流程,确保数据的高效、准确流转,为业务决策和数据分析提供可靠支撑。
核心职责
1. 数据体系建设
设计并实现高效可靠的数据ETL/ELT流程
开发和维护数据仓库各层(ODS/DWD/DWS/ADS)数据处理逻辑
构建实时数据管道,支持流批一体数据处理
2. 数据处理开发
编写高质量SQL和分布式计算程序(Spark/Flink)
优化数据处理作业性能,降低资源消耗
解决海量数据场景下的计算和存储挑战
3. 数据质量保障
设计和实施数据质量监控体系
开发数据校验和异常处理机制
建立数据血缘追踪和影响分析能力
4. 技术方案落地
参与数据技术选型和架构设计
负责医疗行业大数据平台的规划、设计与落地,包括数据采集、存储、处理、分析及可视化全流程架构。
设计高可用、可扩展、安全的分布式系统,支持PB级医疗数据(如电子病历、影像数据、基因组数据、IoT设备数据等)的高效处理。
结合医疗行业特性(如HIPAA、GDPR等合规要求),设计符合隐私保护和数据安全的架构方案。
推动数据开发规范和最佳实践
指导初级工程师,提升团队整体能力
任职要求
技术能力
精通SQL和至少一种编程语言(Python/Java/Scala)
精通大数据生态技术(Hadoop/Spark/Flink/Kafka/Hive等),熟悉流批一体架构。
熟悉数据仓库建模和维度建模理论
掌握Linux环境和Shell脚本编写
了解常见数据库和存储技术(MySQL/HBase/Kudu)
行业经验
5年以上大数据架构经验,3年以上医疗健康领域相关项目经验。
熟悉医疗业务场景(如临床决策支持、真实世界研究、医保风控、药物研发等)。
主导过PB级数据处理项目
有完整的数据仓库建设经验
处理过复杂业务场景下的数据问题
加分项
熟悉云原生数据服务(EMR/Databricks)
了解数据湖技术(Delta Lake/Iceberg/paimon)
有数据治理相关经验
参与过开源项目贡献