岗位职责:
1. 负责基于双目/多摄像头/激光的融合环境感知,完成动/静态3D目标检测,通用物体Occ检测,3D人体姿态估计算法等。
2. 开发适配大模型VLM/VLA的场景表征/对齐技术和场景语义识别。训练图像/视频与文本融合的多模态理解大模型,提升模型的跨模态理解能力;
3. 构建模型训练数据集和设计标注方法,支持大批量自动化的标注构建
4. 应用模仿学习,在/离线强化学习(IL/RL)进行模型训练提升模型性能,开发高效的模型评测方法提高迭代效率
5. 解决模型评测/部署/真机测试中遇到的问题,满足项目交付指标要求
6. 跟踪前沿技术方案,持续迭代升级方案。
岗位要求:
1. 人工智能、计算机、机器人、自动驾驶等相关专业硕士或博士学位
2. 熟练掌握环境感知主流3D检测/OCC模型,了解ResNet、ViT,SAM,BEV,Sparse。监督训练/若监督训练经验,数据标注与模型评测经验。
3. 有智能驾驶/机器人动静态感知,occ感知相关工程经验
4. 熟练使用PyTorch/TensorFlow深度学习框架,熟练使用Python/C++语言编程,有实际项目开发经验
5. 熟悉机器人常用开发环境Mojuco/NVIDIA Isaac/gazebo
6. 有 ROS2/DDS下的开发经验,能够在Linux环境下独立进行开发和调试;
加分项:
7. 有智能驾驶/机器人领域的工程落地经验者优先
8. 在机器人顶会(SR/IJRR/TRO/RSS/ICRA/IROS等)或AI顶会(CVPR/NeurIPS/ICML/ICLR等)发表论文者优先
公司创立于2019年3月,主要从事技术开发,信息服务