岗位职责:
1. 负责视觉相关算法的研究与开发;
2. 负责音频技术和多模态大模型的研究、开发与产品落地;
3. 推动视觉、音频及多模态技术的融合创新,确保算法的稳定性与高效性;
4. 跟进最新的计算机视觉与多模态技术发展,推动公司产品技术持续创新。
岗位要求:
1. 计算机、人工智能、图像处理或语音相关专业本科及以上学历,211,985毕业优先;
2. 熟悉计算机视觉领域基础算法,有目标检测、目标跟踪、姿态估计等相关经验优先;
3. 熟悉语音合成技术和多模态大模型的开发经验者优先;
4. 熟练使用Python,掌握常用深度学习框架;
5. 有良好的团队协作能力与沟通能力;
6. 对视觉、音频技术或多模态技术有强烈兴趣者优先考虑。