【岗位职责】
1、负责语音对话大模型(如端到端语音交互、语音生成、多轮对话理解)的设计、训练、优化,提升模型在真实场景中的表现(如低延迟、高准确率、强鲁棒性)。
2、研究探索能根据声设、语境、文本 合成 在 能量、频率、速度 等维度上混淆真人的音频合成模型。
3、探索语音与文本多模态数据的联合建模,优化语音对话系统的上下文理解与生成能力。
4、负责语音对话领域的高质量数据采集、清洗、标注方案设计。
5、推动算法在公司内业务落地,解决实际业务中的效果等问题。
【岗位要求】
1、计算机科学、人工智能、语音合成、语音识别等相关专业硕士及以上学历,博士优先。
2、熟练掌握PyTorch/TensorFlow框架。
3、熟练掌握常用深度学习模型,具备大模型(如语音对话、语音合成、语音识别、LLM等领域)训练调优经验。
4、深入理解语音处理技术(ASR/TTS)及对话系统(任务型/开放域对话)。
腾讯以技术丰富互联网用户的生活。
通过通信及社交平台微信和 QQ 促进用户联系,并助其连接数字内容和生活服务,尽在弹指间。
通过高效广告平台,协助品牌和市场营销者触达数以亿计的中国消费者。
通过金融科技及企业服务,促进合作伙伴业务发展,助力实现数字化升级。
我们大力投资于人才队伍和推动科技创新,积极参与互联网行业协同发展。
腾讯于 1998 年11月在中国深圳成立,2004 年6月在香港联合交易所主板上市。