智能语音算法工程师

职位描述

1、负责字节旗下音频内容创作和消费业务场景的智能移频理解和处理算法研发和业务支持，业务包括但不限于抖音，西瓜视频、直播、剪映等；

2、搭建智能音频理解和处理的系统级解决方案，为字节智能音频ToB提供技术火力；

3、跟踪智能音频领域的最新技术进展并升级团队自研的各算法系统，包括3D空间渲染，音频质量提升系统,，音频事件检测系统，音频理解系统等；

4、跟进产品业务的音频需求，持续改进产品的音频质量体验；

5、跟踪研发业界先进的音频进展，统计模型/机器学习/深度学习技术在语音/音频领域研发并落地产品。

职位要求

1、丰富的数字信号处理和人工智能/深度学习系统研发经验：在3D空间音频渲染，降噪/回声/去混响等音频前处理，声纹/唤醒，声音事件检测，语音识别，自然语言处理等一个或几个领域有项目实践；

2、熟悉数据结构和算法, 深度网络模型设计和调熟，练掌握Kaldi, TensorFlow, Pytorch等开源工具。有大规模训练数据集上进行模型训练和探索经验优先；

3、良好的团队合作意识和学习能力，有业务意识，对语音和音频领域技术有热情；

4、在相关国际会议或主流期刊上发表论文者优先（ICASSP，Interspeech，ASRU)。

公司地点：北京海淀区中航广场矮楼北三环西路43号中航广场1号楼（矮楼）

字节跳动成立于2012年3月，公司使命为“Inspire Creativity, Enrich Life（激发创造，丰富生活）”。公司业务覆盖150个国家和地区，拥有15万名员工。

字节跳动在全球推出了多款有影响力的产品，包括今日头条、抖音、西瓜视频、飞书、Lark、PICO、剪映、TikTok等。截至2021年6月，字节跳动旗下产品全球月活跃用户数超过19亿。