AI算法工程师(语音智能方向)

一、岗位职责

1. 深度参与语音大模型技术的研发:涵盖数据工程、模型优化、效果评估、反馈闭环及部署加速等关键环节,确保语音识别与合成系统的高效运行与持续改进。设计并实现先进的语音识别算法,包括但不限于声学模型、语言模型和解码器的训练与优化。研究最新的TTS技术,参与语音合成大模型研发工作,确保生成的声音更加自然流畅。参与语音及多模态大模型研发,提升模型整体性能。

2. 核心工程开发与性能优化:专注于语音识别与合成过程中涉及的意图识别、信息抽取、向量检索、知识问答以及Agent等关键技术的开发与优化,提升系统性能与用户体验。负责语音信号处理、自然语言处理等方向算法的研发及落地。结合业务需求,将最新的大模型研究成果应用于实际产品中,提高用户体验。

3. 客户需求沟通与功能价值分析:积极参与客户需求的沟通,深入分析功能价值,解决行业痛点问题,推动先进技术在AIoT、能源双碳、机器人、企业应用等多个场景中的规模化落地,打造不可替代的价值。

4. 技术趋势跟踪与团队建设:持续关注国内外语音处理领域的最新动态和技术趋势,快速学习并应用于项目实践中。

二、任职要求

1.计算机、人工智能、应用数学等相关专业的硕士或博士学位,具备扎实的编程基础。

2.信号处理技术:深入理解语音信号处理的基本原理,掌握滤波器设计、降噪算法及频谱分析技术。

3.机器学习与深度学习:熟悉传统机器学习算法及其在语音领域的应用。精通深度学习理论,了解常见神经网络架构,包括但不限于:RNN、LSTM/GRU、Transformer及相关变体、能够使用深度学习框架实现模型训练与优化。

4.语音识别与合成技术:熟悉语音识别系统的整体架构,包括声学模型、语言模型和解码器的设计与优化。掌握文本到语音成技术,包括波形生成方法和声码器。对端到端模型有深入理解。

5.开源工具与平台:熟悉并能灵活运用相关开源工具和框架,例如:Kaldi、Mozilla DeepSpeech、NVIDIA NeMo、cosyvoice、F5、bestvits、gptsovits能够快速上手并改进现有开源项目。

6.综合能力要求:具备强烈的创新意识和钻研精神,良好的沟通能力和团队协作能力,责任心强,自驱力高,能够从0到1推动业务发展,具备优秀的问题分析和解决能力。具备良好的英语读写能力,能够阅读英文文献并复现其中提到的算法。

7.学术成就:在国际顶级会议(如ICASSP、INTERSPEECH、NeurIPS等)上发表过论文优先。

公司地点:北京朝阳区启皓大厦

公司简介:

职位发布者:万经理

特斯联科技集团有限公司

融资阶段:

公司规模:100~499人

相似职位: