岗位职责:
1. 研究应用大模型实现四足、人形机器人的复杂认知能力,包括:交互、场景理解、长程任务规划、行为决策推理与动作规划等;
2. 实现跨模态(视/听/触/文)的理解能力和对齐;
3. 设计构建模型训练数据集和标注方法,支持大批量自动化的标注构建
4. 负责基模型的领域预训练,模型微调SFT、强化学习(RLHF)训练,提升夸任务的泛化性能,开发高效的模型评测方法提高迭代效率,
5. 解决模型评测/部署/真机测试中的问题,满足项目交付指标要求
6. 跟踪前沿技术方案,持续迭代升级方案
岗位要求
1. 人工智能、计算机、机器人、自动驾驶、自然语言处理等相关专业硕士或博士学位
2. 熟练掌握主流大模型技术(Bert、GPT、Llama、transformer等),有VLM模型(Llava、QwenVL等)、VLA(action token)模型应用经验,熟悉CLIP、ViT、DINO、SAM等, 熟悉生成式AI 技术(diffusion)。
3. 掌握主流的具身大模型技术(RT2, π系列、OpenVLA,ACT, Diffusion Policy)
4. 熟悉大模型轻量化技术(剪枝、蒸馏、量化等)
5. 熟练掌握大模型微调方法(LoRA/P-tuning等)、RL方法(PPO/DPO/GRPO、A3C等);
6. 具备多模态数据融合(文+视+听)研发经验;
7. 掌握大模型的分布式训练框架
8. 熟练使用PyTorch/TensorFlow深度学习框架,熟练使用Python/C++语言编程,有实际项目开发经验
9. 有 ROS2/DDS下的开发经验,能够在Linux环境下独立进行开发和调试;
加分项:
10. 有智能驾驶、具身智能、CV等领域实际的大模型系统开发经验者优先
11. 在机器人顶会(SR/IJRR/TRO/RSS/ICRA/IROS等)或AI顶会(CVPR/NeurIPS/ICML/ICLR等)发表论文者优先
公司创立于2019年3月,主要从事技术开发,信息服务