大数据引擎开发工程师

岗位职责

1. 负责基于 Spark 3.x 的下一代计算引擎架构设计及核心模块开发(Native Runtime、Catalyst 优化器扩展)。

2. 引入并二次开发 Blaze Native Engine(Rust + JNI),完成存量任务从spark往blaze迁移。

3. 负责 Hadoop 3.x 集群的运维自动化与性能调优,保障 99.9% 可用性。

4. 跟踪 Spark / YARN / Blaze / Hadoop 社区动态,如 Spark on Kubernetes、Celeborn RSS。

5. 与数据开发、SRE、算法团队高效协作,推动需求落地;编写技术文档并组织内部分享,沉淀最佳实践。

岗位要求

1. 计算机科学或相关专业本科及以上学历。

2. 3 年以上大数据引擎或平台开发经验,熟悉 Spark 3.x 内核(Catalyst、Tungsten、AQE)。

3. 深入理解 YARN 资源调度原理,具备调优经验。

4. 熟悉 Blaze(或 Velox/Gluten)Native Engine 架构,有向量化执行、JNI 调优实战经验。

5. 熟练运维 Hadoop 3.x(HDFS NameNode HA、Router Federation、滚动升级)。

6. 精通 Java/Scala,熟悉 Rust 或 Go 者优先;有大型代码重构成功案例。

7. 熟悉 Linux 操作系统及常用开发调试工具;具备快速学习能力与技术热情。

8. 良好的沟通能力和团队合作精神,能跨职能推动复杂项目落地。

公司地点:杭州三深国际中心A座F7层

公司简介:

职位发布者:马女士

广州欢聚时代信息科技有限公司

融资阶段:

公司规模:100~499人

相似职位: