岗位职责:
1. 负责语音识别、语音合成、数字人方向的算法研发;
2. 负责AIGC音频大模型、实时情感对话语音合成、低资源音色克隆、变声、说话人识别、关键词唤醒等技术研发;
3. 跟进学术界、行业最新的研究趋势,产出新的科研成果,并落地应用。
任职要求:
1. 硕士及以上学历,人工智能、语音、自然语言处理、机器学习、计算机等相关专业方向,基础扎实;
2. 深刻理解 TTS 原理,熟悉TTS前端、TN、G2P、韵律预测等;
3. 熟悉开源架构声学模型和声码器等;
4. 熟悉主流的语音识别模型算法;
5. 有较强的算法实现能力,熟练掌握 Python/C++/Shell编程,熟悉Linux系统,至少熟练使用一种深度学习训练框架,如Pytorch、Tensorflow等;
6. 学习能力强,优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情。