岗位职责:
1.负责手机及耳机、音箱等关联设备音频前/后处理及编解码算法的研究与开发.
2.对音频降噪/回声消除/声音定位及分离/语音增强/声音特效/空间音频回放/音频编解码及其他各种音频算法技术有较深的研究和了解,能够独立完成相关项目。
3.使用传统去噪算法(OMLSA-MMSE、WebRTC_NS,RNNoise等)进行降噪。
4.负责数据的预处理(VAD等),构建实际场景数据集;
5、考虑到降噪处理效率需求,进行深度学习去噪模型的选型和优化,使用CED+两阶段改进的conformer作为去噪网络,对幅度谱进行增强。
6、将上述核心算法应用到各种复杂现实场景中;
7、熟悉Python、C++及java语言能进行算法开发;熟练使用TensorFlow、Pytorch等框架,以及opencv库;有独立建模、训练、优化的经验;
8、熟悉图像处理算法,计算机视觉、深度学习算法研发与部署,包括物体检测,图像分割,OCR等;熟悉各种深度学习算法,如SSD,fasterrcnn,reid,maskrcnn,yolo等;