岗位职责:
- 负责多模态大模型(VLM: Vision-Language Model / VLA: Vision-Language-Action Model)在人形机器人中的算法设计与开发,将VLM/VLA 应用于人形机器人的智能操作与人机交互任务;
- 参与大模型的预训练、后训练(SFT + RL)及部署工作,支持机器人在复杂环境下的感知与行为能力;
- 与机器人平台团队、硬件团队紧密协作,实现模型在实际机器人系统中的高效运行;
- 跟踪前沿研究,推动新技术在产品中的落地应用。
任职要求:
- 计算机、人工智能、自动化等相关专业硕士及以上学历;
- 具备扎实的深度学习基础,熟悉 Transformer、BERT、ViT、CLIP、BLIP 等主流视觉-语言模型架构;
- 有大模型(VLM、LLM)训练/推理优化经验,熟悉其在多模态任务中的应用;
- 有 VLA 建模、生成式模型(如diffusion)、多模态强化学习相关项目背景;
- 熟练使用 PyTorch、TensorFlow 等深度学习框架,具备良好的工程能力和代码实现能力;
- 良好的团队协作与沟通能力,具备快速学习和解决问题的能力。
加分项:
- 熟悉机器人感知与控制领域,理解人形机器人操作、导航、交互、动作轨迹预测等基本任务流程;
- 有参与实际机器人系统或多模态交互系统开发的项目经验;
- 熟悉开源大模型生态(如 LLaVA, Pi0, RT-2, OpenVLA 等)并有实际使用或改进经验;
- 具备从零构建多模态系统或算法平台的能力。
小鹏汽车致力于通过探索科技,引领未来出行变革,做“未来出行探索者”。公司总部位于广州,在北京、上海、深圳、肇庆、扬州等地设有研发中心,并在肇庆布局智能制造基地。同时,小鹏汽车面向全球进行研发和销售布局,已在美国设立研发中心、在欧洲多地设立分公司。小鹏汽车坚持全栈自主研发智能辅助驾驶软件和开发核心硬件,为用户带来卓越的智能驾乘体验。2020年8月27日,小鹏汽车正式登陆纽交所,募资规模打破当时全球新能源汽车行业IPO纪录,股票代码为“NYSE:XPEV”;2021年7月7日,小鹏汽车挂牌香港联交所,股票代码“9868.HK”,成为首个在中国香港和美国纽约两地双重主要上市的中国造车新势力。欲了解更多信息,请访问https://xiaopeng.com/。