高级大数据开发工程师

岗位职责:

负责数据流和批处理作业设计开发,利用Flume/Flink/Kafka/DataX等进行实时,批量和流批一体大数据处理,接入各类数据源。

负责湖仓一体业务架构,数据架构,技术架构设计,数据建模设计,确保数据模型的灵活性和可扩展性。

负责基于Doris等湖仓一体架构搭建,数据治理工作,包括数据接入、清洗、转换和建模,确保数据的一致性和准确性。

负责Doris数仓性能的优化,包括查询优化、索引管理和存储策略,以支持大数据统计分析和机器学习应用。

负责评估和引入新的大数据技术,确保与现有系统的无缝集成,提升数据底座的整体性能。

与需求业务人员紧密合作,提供技术支持,参与团队内部的技术分享和培训;

任职要求:

教育背景:计算机科学、软件工程或相关专业本科及以上学历,985或211统招。

行业背景:交通领域行业从业经历,熟悉交通领域相关基础数据

开发经验:5年+Java开发经验,掌握Spring boot,熟悉k8s和Docker的原理和项目部署。

大数据经验:3年+大数据开发经验,掌握Flink,FlinkCDC,SeaTunnel、Spark,ES,Hive等大数据技术。

湖仓经验:3年+Doris数据仓库搭建、建模和开发实战经验。掌握IceBerg,Hudi等常见数据湖架构,精通Doris架构、建模,查询优化和性能调优,掌握Airflow,dolphinscheduler调度框架的搭建和使用。熟悉主数据管理、元数据管理、ODS/DWD/DWS/ADS数据建模等。

解决问题:具备出色的分析和解决问题的能力,能够独立解决复杂的技术问题。

团队合作:优秀的沟通能力和团队合作精神,能够与跨职能团队有效协作。

公司地点:北京朝阳区易亨大厦12层

公司简介:

职位发布者:刘经理

国交空间信息技术(北京)有限公司

融资阶段:

公司规模:

相似职位: