(资深/高级)实时/离线数仓研发工程师

【岗位职责】

1. 深入理解滴滴海外业务模式、流程和系统架构,和相关产品技术、业务运营高效沟通,设计合理的数据仓库架构。

2. 充分利用滴滴现有的各种数据仓库及反作弊处理平台,设计、开发和维护高效、可扩展的大数据处理系统,以支持安全反作弊业务的数据驱动决策和业务发展。设计并优化离线/实时数仓模型(如 ODS、DWD、DWS、ADS 分层),支持实时报表、监控和风控等场景。

3. 对多源异构数据(日志、事件消息、API、爬虫数据等)进行清洗、解析和结构化处理,提取关键业务信息。解决数据清洗中的 脏数据、格式混乱、缺失值、重复数据 等问题,提升数据质量。与数据开发、算法、业务团队协作,理解需求并构建高效的数据处理流程。

4. 跟踪大数据领域的新技术、新工具,不断探索并引入以提升团队的技术能力和项目效率。优化流式计算任务的 资源利用率(如 Flink 任务调优、Kafka 分区策略调整)。

5. 国际化安全反作弊技术团队其他开发工作。

【任职要求】

1. 统招本科及以上学历,计算机等相关专业; 3年及以上的互联网数据仓库开发工作经验,对业务和数据敏感

2. 熟悉大数据处理架构(如Flink、Spark Streaming、Kafka Streams等),熟悉数据集成解决方案,实现跨平台、跨系统的数据ETL。

3. 熟悉 MySQL、Redis、HBase、ClickHouse/Doris 等存储技术。能优化实时数据查询性能(如预聚合、索引优化)。

4. 熟悉 SQL,能编写复杂数据处理逻辑(如窗口函数、CDC 处理)。熟练使用 Python/Java/Scala 至少一种语言,能开发高效的数据清洗脚本。

5. 具备 非结构化/半结构化数据(JSON、XML、日志、文本等)解析和清洗经验。熟练使用 正则表达式、ETL 工具(如 Logstash、NiFi)、UDF 开发等技术进行数据规范化处理。

6. 熟悉 Linux 环境,具备 集群监控(Prometheus/Grafana)、故障排查 经验。

【加分项】

1. 具备国际化风控业务经验优先

2. 有算法经验者优先

3. 了解爬虫极其数据处理经验者优先

4. 了解图数据库、向量数据库这优先

5. 因为会与国外同事交流,或有国外出差机会,英语水平流利者为佳。

公司地点:北京昌平区万科天空之城b座

公司简介:

滴滴出行是卓越的一站式移动出行平台;为5.5亿用户提供出租车、快车、专车、豪华车、公交、代驾、企业级、共享单车、共享电单车、共享汽车、外卖等多元化的出行和运输服务。在滴滴平台,超过3100万车主及司机获得灵活的工作和收入机会。

滴滴出行与监管部门、出租车行业及社群积极协作,致力于以智慧交通创新解决全球交通、环保和就业挑战。滴滴也和汽车产业链企业建立广泛的合作,携手打造面向未来的汽车运营服务平台。

在全球范围内,滴滴与Grab、Lyft、Ola、99、Taxify、Careem构建的移动出行网络触达全球超过80%的人口、覆盖1000多座城市。目前,滴滴通过旗下99平台服务巴西,在墨西哥和澳洲提供滴滴品牌的出行业务;并在日本通过合资公司提供网约出租车服务。滴滴始终致力于提升用户体验,创造社会价值,建设安全、开放、可持续的移动出行新生态。

职位发布者:陈女士

滴滴出行科技有限公司

融资阶段:D轮及以上

公司规模:1000~9999人

相似职位: