语音算法工程师/多模态算法工程师

岗位职责：

负责端到端语音多模态大模型的研发与优化。

设计并实现高效的语音识别算法，能够处理多种口音和方言。

与先进的语言模型（LLM）进行对接，包括Agent、RAG等，确保模型能够准确理解并回答用户的问题。

开发和改进语音合成技术，使其具备丰富的情绪表达能力。

参与模型的训练、调优和性能评估，确保模型达到行业领先水平。

与团队协作，需要能规划训练所需的数据，制定数据获取和清洗方案。

技能要求：

熟悉FunAudioLLM，Fish Audio、Qwen2.5-Omni、Kimi-Audio等开源语音模型。

精通深度学习框架，如PyTorch等。

算法出身，具备扎实的机器学习和深度学习理论基础。

熟悉语音识别、语音合成、自然语言处理等领域的算法和技术。

有大规模模型训练和优化的经验。

具备良好的编程能力，熟练掌握Python等编程语言。

公司地点：北京朝阳区融新科技中心A座22层

公司简介：

麒麟合盛网络技术股份有限公司（APUS）成立于2014年7月，是一家以人工智能技术为核心竞争力的全球化移动互联网公司。成立以来，APUS始终秉承“网络全球用户，科技美好生活”的使命，致力于帮助全球用户实现最佳的移动互联网使用体验，现下全面启动“大AI”战略，转型成为以人工智能技术为底座的“全球化人工智能企业”。 APUS“足迹”遍及欧美、东亚、东南亚、南亚、中东等200多个国家和地区，其中包括“一带一路”沿线65个国家；产品支持超过25种国际语言，累计覆盖全球超24亿用户。

公司官网：www.apusai.com

职位发布者：郑女士

麒麟合盛网络技术股份有限公司

融资阶段：

公司规模：100~499人

相似职位：

语音算法工程师/多模态算法工程师麒麟合盛网络技术股份有限公司