具身多模态工程师/深圳、

岗位职责：

1. 研究应用大模型实现四足、人形机器人的复杂认知能力，包括：交互、场景理解、长程任务规划、行为决策推理与动作规划等；

2. 实现跨模态（视/听/触/文）的理解能力和对齐；

3. 设计构建模型训练数据集和标注方法，支持大批量自动化的标注构建

4. 负责基模型的领域预训练，模型微调SFT、强化学习（RLHF）训练，提升夸任务的泛化性能，开发高效的模型评测方法提高迭代效率，

5. 解决模型评测/部署/真机测试中的问题，满足项目交付指标要求

6. 跟踪前沿技术方案，持续迭代升级方案

岗位要求

1. 人工智能、计算机、机器人、自动驾驶、自然语言处理等相关专业硕士或博士学位

2. 熟练掌握主流大模型技术（Bert、GPT、Llama、transformer等），有VLM模型（Llava、QwenVL等）、VLA（action token）模型应用经验，熟悉CLIP、ViT、DINO、SAM等, 熟悉生成式AI 技术（diffusion）。

3. 掌握主流的具身大模型技术（RT2, π系列、OpenVLA，ACT, Diffusion Policy）

4. 熟悉大模型轻量化技术（剪枝、蒸馏、量化等）

5. 熟练掌握大模型微调方法（LoRA/P-tuning等）、RL方法（PPO/DPO/GRPO、A3C等）；

6. 具备多模态数据融合（文+视+听）研发经验；

7. 掌握大模型的分布式训练框架

8. 熟练使用PyTorch/TensorFlow深度学习框架，熟练使用Python/C++语言编程，有实际项目开发经验

9. 有 ROS2/DDS下的开发经验，能够在Linux环境下独立进行开发和调试；

加分项：

10. 有智能驾驶、具身智能、CV等领域实际的大模型系统开发经验者优先

11. 在机器人顶会（SR/IJRR/TRO/RSS/ICRA/IROS等）或AI顶会（CVPR/NeurIPS/ICML/ICLR等）发表论文者优先

公司地点：深圳安克创新科技股份有限公司