语音多模态算法工程师（A80803）

职位描述

1、负责语音识别、语音合成的整体算法设计、实现和优化，支持语音能力在业务中的落地，解决落地过程中的前沿技术难题并且持续优化语音识别、语音合成的核心技术效果

2、结合业务落地方向，探索语音对话大模型中多语种、多情感、多情绪表达的理解和生成技术，设计落地方案并持续推进

3、负责海量多语种的语料的管理，包括数据的收集、存储、清洗等

职位要求

1、本科及以上学历，计算机科学、电子工程、自动化、数学或者相关专业

2、在语音识别、语音合成或者相关领域有3年以上实际工作经验，具备大规模语音数据处理和训练的经验。

3、对深度学习技术有深刻的了解和丰富的实战经验，熟悉pytorch、tensorflow等平台

4、熟悉端到端的语音理解和生成的语音大模型框架，有实践经验的优先。

5、有不错的代码工程能力，熟悉linux的开发环境，熟悉c++或者python语言

公司地点：北京朝阳区叶青大厦北园2层