语音大模型算法(语音赛道独角兽,反馈快)

岗位职责:

1、负责端对端语⾳⼤模型等⽅向上技术的研究与开发。包括但不仅限于声⾳克隆、zero-shot语⾳合

成、⽂⽣语⾳、语⾳转换、ASR等;

2、负责端对端语⾳⼤模型的业务场景应⽤和效果优化;

3、调研和复现业界先进的技术框架,提升⾃研模型的效果和推理性能;

任职资格:

1、要求⼈⼯智能、计算机类、数学类,信号处理等相关专业,三年以上相关⼯作经验,硕⼠及以上;

2、熟练掌握C/C++/python,较强的编码实现能⼒;

3、熟练使⽤tensorflow/pytorch⾄少⼀种深度学习框架,理解深度学习基础理论,有相关平台算法项

⽬经验;

4、精通深度学习、⼤模型训练、⾳频信号处理等领域的基础技术与原理,熟悉SeedTTS、ChatTTS、

CosyVoice、SenseVoice等模型和技术;

5、对岗位所述⽅向有强烈的兴趣,⾃驱并敢于挑战,性格开朗,有合作精神;

6、具有语⾳⼤模型实际项⽬经验优先;

加分项:

在相关国际会议或主流期刊上发表论⽂者优先(ICASSP,Interspeech,ASRU)

公司地点:广州海珠区海洋石油大厦1223-2

公司简介:

职位发布者:徐先生

永亿(广州)网络科技有限公司

融资阶段:

公司规模:

相似职位: