职位描述:
1. 主导语音大模型的前沿算法研究及产业落地;
2. 研发具有语音理解、生成、对话能力的端到端模型,开发流式全模态(语音/文本/视觉)大模型;
3. 持续跟踪前沿技术动态,能够对领域最新技术进行及时吸纳和改进,通过技术创新和工程实践,支撑模型能力提升;
4. 通过论文和技术报告等形式提升团队的技术影响力。
职位要求:
硕士及以上学历,计算机相关专业;
1. 三年以上语音算法开发经验,深入参与过语音交互类全链路模型及产品建设,熟悉 ASR/TTS/LLM/端到端语音大模型 等语音 AI 相关技术原理,并对相关技术有深入理解和思考;
2. 掌握 AI 产品开发的开源工具和框架(如TensorFlow、PyTorch)。具备出色的编程能力和工程能力,熟练掌握Python或其他相关编程语言,具有良好的代码编写习惯和程序开发经验;
3. 具备良好的团队合作精神、沟通能力以及分析和解决问题的能力。