语音大模型算法工程师

【岗位职责】

1、负责语音对话大模型（如端到端语音交互、语音生成、多轮对话理解）的设计、训练、优化，提升模型在真实场景中的表现（如低延迟、高准确率、强鲁棒性）。

2、研究探索能根据声设、语境、文本合成在能量、频率、速度等维度上混淆真人的音频合成模型。

3、探索语音与文本多模态数据的联合建模，优化语音对话系统的上下文理解与生成能力。

4、负责语音对话领域的高质量数据采集、清洗、标注方案设计。

5、推动算法在公司内业务落地，解决实际业务中的效果等问题。

【岗位要求】

1、计算机科学、人工智能、语音合成、语音识别等相关专业硕士及以上学历，博士优先。

2、熟练掌握PyTorch/TensorFlow框架。

3、熟练掌握常用深度学习模型，具备大模型（如语音对话、语音合成、语音识别、LLM等领域）训练调优经验。

4、深入理解语音处理技术（ASR/TTS）及对话系统（任务型/开放域对话）。

公司地点：深圳南山区光启未来中心A栋腾讯办公楼

腾讯以技术丰富互联网用户的生活。

通过通信及社交平台微信和 QQ 促进用户联系，并助其连接数字内容和生活服务，尽在弹指间。

通过高效广告平台，协助品牌和市场营销者触达数以亿计的中国消费者。

通过金融科技及企业服务，促进合作伙伴业务发展，助力实现数字化升级。

我们大力投资于人才队伍和推动科技创新，积极参与互联网行业协同发展。

腾讯于 1998 年11月在中国深圳成立，2004 年6月在香港联合交易所主板上市。