语音多模态算法工程师(A80803)

职位描述

1、负责语音识别、语音合成的整体算法设计、实现和优化,支持语音能力在业务中的落地,解决落地过程中的前沿技术难题并且持续优化语音识别、语音合成的核心技术效果

2、结合业务落地方向,探索语音对话大模型中多语种、多情感、多情绪表达的理解和生成技术,设计落地方案并持续推进

3、负责海量多语种的语料的管理,包括数据的收集、存储、清洗等

职位要求

1、本科及以上学历,计算机科学、电子工程、自动化、数学或者相关专业

2、在语音识别、语音合成或者相关领域有3年以上实际工作经验,具备大规模语音数据处理和训练的经验。

3、对深度学习技术有深刻的了解和丰富的实战经验,熟悉pytorch、tensorflow等平台

4、熟悉端到端的语音理解和生成的语音大模型框架,有实践经验的优先。

5、有不错的代码工程能力,熟悉linux的开发环境,熟悉c++或者python语言

公司地点:北京朝阳区叶青大厦北园2层

公司简介:

职位发布者:潘经理

北京米连科技有限公司

融资阶段:

公司规模:

相似职位: