AI音频算法工程师

1、负责文本到语音（TTS）合成算法的设计、实现与优化，提升语音自然度和合成质量；

2、开发和优化音色克隆技术，实现特定人物或风格的声音仿真与迁移；

3、研究和实现歌曲生成相关算法，包括旋律生成、伴奏合成等；

4、设计并优化声音降噪、回声消除、去混响等音频信号处理算法，提高音频质量；

5、参与大规模语音和音频数据的收集、预处理及分析，提升模型效果；

跟踪国内外AI音频领域最新技术动态，持续改进和创新算法；

任职要求：

1、计算机科学、信号处理、人工智能、数学或相关专业本科及以上学历；

2、扎实的数字音频信号处理理论基础，熟悉语音合成、语音转换、音频生成及降噪等技术；

3、熟练掌握Python和C/C++编程语言，具备良好的代码规范和文档编写能力；

4、熟悉主流机器学习和深度学习框架（如TensorFlow、PyTorch），有实际项目经验；

5、具备1年以上TTS、音色克隆、音频生成或声音降噪相关工作经验，有商业化产品经验者优先；

6、有音频处理软件使用经验（如MATLAB、Python音频库）及实时音频处理系统开发经验者优先；

7、良好的团队协作能力和沟通能力，能适应快速变化的研发环境。

加分项：

1、参与过语音大模型、端到端语音合成或音色克隆相关项目；

2、具备音乐生成、旋律生成相关算法研究或应用经验；

3、对游戏音频、电影声音处理有兴趣和相关经验；

4、发表过相关领域高水平论文或拥有专利。

公司地点：杭州西湖区华星时代广场A座22F-小影科技