大模型算法工程师（多模态方向）

岗位职责：

- 负责多模态大模型（VLM: Vision-Language Model / VLA: Vision-Language-Action Model）在人形机器人中的算法设计与开发，将VLM/VLA 应用于人形机器人的智能操作与人机交互任务；

- 参与大模型的预训练、后训练（SFT + RL）及部署工作，支持机器人在复杂环境下的感知与行为能力；

- 与机器人平台团队、硬件团队紧密协作，实现模型在实际机器人系统中的高效运行；

- 跟踪前沿研究，推动新技术在产品中的落地应用。

任职要求：

- 计算机、人工智能、自动化等相关专业硕士及以上学历；

- 具备扎实的深度学习基础，熟悉 Transformer、BERT、ViT、CLIP、BLIP 等主流视觉-语言模型架构；

- 有大模型（VLM、LLM）训练/推理优化经验，熟悉其在多模态任务中的应用；

- 有 VLA 建模、生成式模型（如diffusion）、多模态强化学习相关项目背景；

- 熟练使用 PyTorch、TensorFlow 等深度学习框架，具备良好的工程能力和代码实现能力；

- 良好的团队协作与沟通能力，具备快速学习和解决问题的能力。

加分项：

- 熟悉机器人感知与控制领域，理解人形机器人操作、导航、交互、动作轨迹预测等基本任务流程；

- 有参与实际机器人系统或多模态交互系统开发的项目经验；

- 熟悉开源大模型生态（如 LLaVA, Pi0, RT-2, OpenVLA 等）并有实际使用或改进经验；

公司地点：深圳南山区科技园