大数据处理工程师

主要职责：

1. 设计和实现高效的数据湖架构，支持多种数据格式和处理模式

2. 开发和优化数据处理管道，确保数据的准确性、一致性和可用性

3. 构建灵活的数据存储和查询解决方案，支持多样化的业务需求

4. 实现数据版本控制和数据治理机制，提升数据质量和可追溯性

5. 设计和开发数据服务接口，支持上层应用和业务系统的数据需求

6. 优化数据处理性能，确保系统的可扩展性和可靠性

7. 参与技术选型和架构决策，推动团队技术创新

技能要求：

1. 计算机科学、软件工程或相关领域的学士及以上学位

2. 5年以上大数据开发经验，深入理解数据湖架构和设计模式

3. 精通主流大数据技术栈，包括但不限于：

- 分布式存储系统

- 流处理和批处理引擎

- 数据湖存储格式和技术

- 元数据管理和数据目录工具

4. 扎实的编程基础，精通Java，熟悉Python或Scala

5. 具备设计和实现复杂ETL流程的经验

6. 熟悉实时数据处理和流处理技术

7. 具备处理结构化和非结构化数据的经验

8. 了解数据版本控制和数据治理最佳实践

9. 具备优秀的问题解决能力和团队协作精神

加分项：

1. 具备大规模分布式系统设计和优化经验

2. 熟悉机器学习和AI技术，能够支持数据科学团队的需求

3. 有开源项目贡献经验

4. 了解云原生技术和容器化部署

5. 具备数据安全和隐私保护相关经验

公司地点：上海易碳数科1

公司简介：

职位发布者：陈隽逸

成都万有码力科技有限公司

融资阶段：B轮

公司规模：10000人以上

相似职位：

大数据处理工程师成都万有码力科技有限公司