职位描述
1、负责语音识别、语音合成的整体算法设计、实现和优化,支持语音能力在业务中的落地,解决落地过程中的前沿技术难题并且持续优化语音识别、语音合成的核心技术效果
2、结合业务落地方向,探索语音对话大模型中多语种、多情感、多情绪表达的理解和生成技术,设计落地方案并持续推进
3、负责海量多语种的语料的管理,包括数据的收集、存储、清洗等
职位要求
1、本科及以上学历,计算机科学、电子工程、自动化、数学或者相关专业
2、在语音识别、语音合成或者相关领域有3年以上实际工作经验,具备大规模语音数据处理和训练的经验。
3、对深度学习技术有深刻的了解和丰富的实战经验,熟悉pytorch、tensorflow等平台
4、熟悉端到端的语音理解和生成的语音大模型框架,有实践经验的优先。
5、有不错的代码工程能力,熟悉linux的开发环境,熟悉c++或者python语言