岗位职责:
负责端到端语音多模态大模型的研发与优化。
设计并实现高效的语音识别算法,能够处理多种口音和方言。
与先进的语言模型(LLM)进行对接,包括Agent、RAG等,确保模型能够准确理解并回答用户的问题。
开发和改进语音合成技术,使其具备丰富的情绪表达能力。
参与模型的训练、调优和性能评估,确保模型达到行业领先水平。
与团队协作,需要能规划训练所需的数据,制定数据获取和清洗方案。
技能要求:
熟悉FunAudioLLM,Fish Audio、Qwen2.5-Omni、Kimi-Audio等开源语音模型。
精通深度学习框架,如PyTorch等。
算法出身,具备扎实的机器学习和深度学习理论基础。
熟悉语音识别、语音合成、自然语言处理等领域的算法和技术。
有大规模模型训练和优化的经验。
具备良好的编程能力,熟练掌握Python等编程语言。
麒麟合盛网络技术股份有限公司(APUS)成立于2014年7月,是一家以人工智能技术为核心竞争力的全球化移动互联网公司。成立以来,APUS始终秉承“网络全球用户,科技美好生活”的使命,致力于帮助全球用户实现最佳的移动互联网使用体验,现下全面启动“大AI”战略,转型成为以人工智能技术为底座的“全球化人工智能企业”。 APUS“足迹”遍及欧美、东亚、东南亚、南亚、中东等200多个国家和地区,其中包括“一带一路”沿线65个国家;产品支持超过25种国际语言,累计覆盖全球超24亿用户。
公司官网:www.apusai.com