多模态算法工程师(语音合成)

职位描述

1.深入对接业务需求,将多模态大模型技术应用于语音合成、语音交互、视频内容生成等核心场景,推动高质量语音技术与多模态系统结合落地并产生业务价值;

2.独立或协同团队完成语音合成相关算法的研发与优化,包括跨模态语音生成、情感化TTS、音视频融合表达等关键技术,提升语音自然度与表现力;

3.跟踪多模态与语音合成交叉领域的前沿技术,推进相关技术预研与创新性原型构建。

职位要求

1.计算机、人工智能、信号处理等相关专业硕士及以上学历,3年以上多模态或语音合成相关算法研发经验;

2.具备扎实的多模态或语音算法基础,深入理解TTS技术链路,具备语音-多模态融合项目经验者优先;

3.熟练掌握 Python/C++ 等编程语言及PyTorch/TensorFlow 等深度学习框架,具备语音合成或多模态算法研发和系统实现经验;

4.具备良好的英文文献阅读和算法实现能力,在语音或多模态领域顶会发表过论文或持有相关专利者优先。

公司地点:北京海淀区盈都大厦B座北京海淀区知春路盈都大厦B座21层

公司简介:

职位发布者:蒋先生

北京力拓飞远科技有限公司

融资阶段:

公司规模:

相似职位: