岗位职责:
1.主导/参与基于大模型(LLM)的语音合成算法研发与创新,显著提升合成语音的自然度、表现力与情感表达能力。
2.深入研究和实现声音克隆技术,开发高效、高保真、可控性强的个性化语音生成方案。
3.设计并开发精品音色算法,专注于打造具有独特风格、高辨识度及商业价值的优质音色库。
4.优化语音合成算法性能(包括推理速度、资源占用),确保其在多语言、多场景下的鲁棒性与稳定性。
4.负责算法模块的测试、调试与效果评估,确保输出质量达到行业领先水平。
5.编写清晰、规范的技术文档,支持团队协作及技术成果的落地应用。
任职要求:
1.精通语音合成(TTS)领域,尤其在大模型语音合成、声音克隆、音色建模与迁移、声学模型/端到端合成等方向有扎实的理论基础和实践经验。能够独立承担相关核心算法的设计、实现与优化工作。
2.具备优秀的算法分析和问题解决能力,尤其在提升大模型合成效果、优化克隆音色相似度与自然度、打造精品音色特性等方面有突出能力。
3.熟悉主流语音合成技术栈(如声码器、声学模型、前端文本处理等)。熟练掌握深度学习相关技术,并能在语音合成领域灵活应用。
4.扎实的编程能力(Python为主),熟悉PyTorch/TensorFlow等深度学习框架,熟练运用C++编程者优先。
5.优秀的沟通协作能力和团队合作精神,能有效推动跨团队项目。
6.对语音技术前沿(特别是大模型、生成式AI在语音领域的应用)保持高度热情,具备快速学习和技术攻关能力。
追一科技成立于2016年3月,是领先的人工智能公司和AI数字员工提供商,我们主攻深度学习和自然语言处理,提供智能语义,语音和视觉的AI全栈服务。我们的AIForce智能平台能与业务场景深度融合,提供不同类型的AI数字员工,满足企业和政府用户服务、营销、运营、 办公等多种场景的智能化升级需求,帮助他们降本提效,改善用户体验,驱动创新和增长。
成立五年来,我们的AI数字员工产品实现了大规模商业应用,服务了金融、互联网、地产、零售、汽车、政企、能源、电信运营商等多个行业的数百家标杆客户。
一流的技术和产品团队是我们成长的基石,在这里,我们的领头人为原腾讯AI平台负责人;核心团队中,国内顶尖技术专家占比80%以上,绝大部分成员为硕士和博士学历。在产品开发领域,我们拥有极强的AI应用与攻坚能力。我们的工程团队包含了多名来自阿里、腾讯、百度的专家和高级工程师,具备强大的架构设计、代码实现能力,以及工程效能提升能力,产品团队也均来自海内外知名科技企业。我们的AIForce平台经国家一级查新机构鉴定含国内首创技术,其中Bot智能客服机器人经国家一级查新机构鉴定含国内领先技术、首批通过智能语音产品国标评测,多次入选优秀案例。
追一快速成长获得了顶级资本机构认可与支持。公司成立至今,先后获得晨兴资本数百万美元的天使轮投资,高榕资本、晨兴资本数百万美元的A轮融资。2017年11月完成2060万美元B轮融资,投资方包括创新工场、GGV、晨兴资本和高榕资本。2019年4月完成4100万美元C轮融资,招商局旗下中白产业投资基金领投,创新工场、晨兴资本、高榕资本、GGV和中移创新产业基金跟投。人工智能权威、创新工场董事长兼CEO李开复评价:追一科技为国内乃至全球最好NLP公司之一。