1、负责文本到语音(TTS)合成算法的设计、实现与优化,提升语音自然度和合成质量;
2、开发和优化音色克隆技术,实现特定人物或风格的声音仿真与迁移;
3、研究和实现歌曲生成相关算法,包括旋律生成、伴奏合成等;
4、设计并优化声音降噪、回声消除、去混响等音频信号处理算法,提高音频质量;
5、参与大规模语音和音频数据的收集、预处理及分析,提升模型效果;
跟踪国内外AI音频领域最新技术动态,持续改进和创新算法;
任职要求:
1、计算机科学、信号处理、人工智能、数学或相关专业本科及以上学历;
2、扎实的数字音频信号处理理论基础,熟悉语音合成、语音转换、音频生成及降噪等技术;
3、熟练掌握Python和C/C++编程语言,具备良好的代码规范和文档编写能力;
4、熟悉主流机器学习和深度学习框架(如TensorFlow、PyTorch),有实际项目经验;
5、具备1年以上TTS、音色克隆、音频生成或声音降噪相关工作经验,有商业化产品经验者优先;
6、有音频处理软件使用经验(如MATLAB、Python音频库)及实时音频处理系统开发经验者优先;
7、良好的团队协作能力和沟通能力,能适应快速变化的研发环境。
加分项:
1、参与过语音大模型、端到端语音合成或音色克隆相关项目;
2、具备音乐生成、旋律生成相关算法研究或应用经验;
3、对游戏音频、电影声音处理有兴趣和相关经验;
4、发表过相关领域高水平论文或拥有专利。