岗位职责:
1、深入理解环卫业务需求,针对性开展计算机视觉、多模态及大规模视觉语言模型算法的创新研究,并将算法应用于环卫事件监测、作业任务调度、质量巡查、垃圾分类等业务场景,实现技术落地;
2、设计并开发高效的多模态视觉识别算法和模型,处理图像、视频、文本、音频等多种数据源;实现跨模态信息整合与理解,提升算法在复杂场景下的适应性和准确性;
3、负责数据集的收集、清洗、标注工作,确保数据质量满足模型训练和评估需求;
4、实施模型的部署工作,监控模型性能,并建立反馈机制以持续优化模型表现;
5、跟踪计算机视觉和多模态技术的前沿进展,探索新的科研问题,推动技术发展。
岗位要求:
1、硕士及以上学历,专业方向包括图像处理、计算机视觉、模式识别、深度学习、多模态等;
2、至少3年多模态视觉识别领域的工作经验,具备实际项目落地经验;发表过CV&AI领域顶会论文者优先,有ACM编程竞赛、人工智能竞赛、计算机视觉竞赛获奖经历者优先;
3、精通C++或Python编程,熟练使用TensorFlow、PyTorch、MXNet等至少一种深度学习框架;
4、熟悉多模态大模型的训练、调优方法;
5、了解多媒体数据处理,具备增强现实/虚拟现实(AR/VR)技术知识;
6、具备出色的沟通和协调能力,优秀的学习能力,具备良好的团队精神,能承受工作压力,富有进取心。