分布式计算与存储工程师(高级/资深/专家)

职位概述:

我们正在寻找一位具备扎实系统工程能力与丰富实践经验的大数据/AI基础设施软件工程师,加入小鹏汽车扶摇AI平台团队。扶摇是支撑小鹏自动驾驶、机器人及智能座舱等核心AI应用的底层基础设施平台。你将参与构建并优化下一代 AI 基础设施体系,涵盖数据加载、数据集与数据生产系统、大规模推理以及分布式计算平台,致力于打造高效、可扩展、高可靠性的 AI 工程底座。

岗位职责:

1. 参与以下一个或多个方向的系统设计与优化工作:

- 设计并优化面向异构数据(如图像、视频、点云、传感器流等)的大规模数据处理、生产与加载流水线;

- 构建和维护高性能的数据集管理与加载框架,保障训练与推理场景下的低延迟、高吞吐数据供给;

- 开发并优化分布式计算与推理系统,包括任务调度、资源利用率提升及性能调优。

2. 与算法、数据湖仓等跨职能团队紧密协作,将业务需求高效转化为可落地的基础设施解决方案;

3. 持续对 AI 数据、推理及计算全链路进行监控、性能剖析与瓶颈消除。

任职要求:

1. 计算机科学、软件工程或相关专业硕士及以上学历,或具备同等能力与经验;

2. 5 年以上大规模数据处理或机器学习基础设施相关工作经验;

3. 精通 Python,具备扎实的软件工程基础、良好的编码规范及强大的调试能力;

4. 熟悉关系型数据库与 NoSQL 系统,具备元数据管理与缓存设计经验;有大规模向量数据库(VectorDB)实战经验者优先;

5. 熟悉 Linux 文件系统及分布式/对象存储环境下的网络 I/O 优化;

6. 具备优秀的沟通能力,能在快节奏环境中高效协同跨团队合作;

7. 学习能力强,能快速适应新技术挑战,并主动探索和引入前沿技术方案。

加分项(Preferred Qualifications)

1. 了解自动驾驶行业,对该领域的技术挑战有浓厚兴趣;

2. 有 Ray、Flink、Spark 等分布式计算框架的实战经验;

3. 具备在云原生环境中构建和扩展 ML 基础设施的经验;

4. 在以下任一领域有深入实践:

- 面向可扩展性与模型加速的大规模深度学习训练/推理优化;

- 列式存储格式(如 Parquet/Lance/ORC)及其生态,包括分区策略、压缩算法与向量化 I/O 优化;

- 大规模数据加载框架(如 PyTorch DataLoader、Hugging Face Datasets)的定制与调优。

加入我们,你将有机会:

1. 深度参与定义下一代智能出行的 AI 基础设施;

2. 与顶尖的算法与工程团队共同攻坚行业前沿难题;

3. 在真实大规模场景中打磨高可用、高性能的系统能力。

公司地点:广州天河区广州小鹏汽车科技有限公司总部松岗大街8号

公司简介:

小鹏汽车致力于通过探索科技,引领未来出行变革,做“未来出行探索者”。公司总部位于广州,在北京、上海、深圳、肇庆、扬州等地设有研发中心,并在肇庆布局智能制造基地。同时,小鹏汽车面向全球进行研发和销售布局,已在美国设立研发中心、在欧洲多地设立分公司。小鹏汽车坚持全栈自主研发智能辅助驾驶软件和开发核心硬件,为用户带来卓越的智能驾乘体验。2020年8月27日,小鹏汽车正式登陆纽交所,募资规模打破当时全球新能源汽车行业IPO纪录,股票代码为“NYSE:XPEV”;2021年7月7日,小鹏汽车挂牌香港联交所,股票代码“9868.HK”,成为首个在中国香港和美国纽约两地双重主要上市的中国造车新势力。欲了解更多信息,请访问https://xiaopeng.com/。

职位发布者:熊经理

广州小鹏汽车科技有限公司

融资阶段:

公司规模:1000~9999人

相似职位: