语音交互开发工程师(端侧)

工作职责:

1.负责 端侧语音交互系统开发,包括语音唤醒、语音识别、语音合成及对话管理模块。

2-参与 座舱系统、小型机器人、IoT 交互设备 的语音服务及场景化交互方案研发。

3-设计并实现 语音服务框架,支持多场景、多模态的交互能力。

4-设计 对话管理引擎(Dialog Manager) 或 多轮对话。

5-与产品、算法、UI/UX 团队紧密协作,实现高效、自然的人机语音交互体验。

6-跟踪行业发展,探索 端云协同语音架构 及 轻量化语音模型 在不同硬件平台的落地应用。

岗位要求:

1.计算机、电子、自动化、通信等相关专业,本科及以上学历,3 年以上语音/音频相关开发经验。

2.熟悉 对话管理、语音服务框架设计,具备实际项目经验。

3.精通 音频采集与播放链路,熟悉 ALSA、AudioFlinger、AudioTrack、OpenSL ES 等音频框架。

4.熟悉 端侧 ASR/TTS 引擎部署(如 Kaldi、WeNet、PaddleSpeech、ESP-SR、PocketSphinx 等),能在资源受限设备上进行性能优化。

5.具备 端云协同语音系统架构设计 及大模型开发经验,能兼顾离线和在线语音服务者优先。

6.掌握 C/C++ 或 Python 开发,熟悉 Android NDK/JNI、iOS Core Audio、嵌入式平台移植 等。

7.有良好的系统设计能力和跨团队沟通能力,能够推动语音交互功能从方案到产品落地。

公司地点:上海徐汇区商汤科技大厦虹梅路1900号

公司简介:

作为人工智能软件公司,商汤科技以“坚持原创,让AI引领人类进步”为使命,旨在持续引领人工智能前沿研究,持续打造更具拓展性更普惠的人工智能软件平台,推动经济、社会和人类的发展,并持续吸引及培养顶尖人才,共同塑造未来。

商汤科技拥有深厚的学术积累,并长期投入于原创技术研究,不断增强行业领先的多模态、多任务通用人工智能能力,涵盖感知智能、自然语言处理、决策智能、智能内容生成等关键技术领域,同时包含AI芯片、AI传感器及AI算力基础设施在内的关键能力。此外,商汤前瞻性打造新型人工智能基础设施——商汤AI大装置SenseCore,打通算力、算法和平台,并在此基础上建立“商汤日日新SenseNova”大模型及研发体系,以低成本解锁通用人工智能任务的能力,推动高效率、低成本、规模化的AI创新和落地,进而打通商业价值闭环,解决长尾应用问题,引领人工智能进入工业化发展阶段。商汤科技业务涵盖智慧商业、智慧城市、智慧生活、智能汽车四大板块,相关产品与解决方案深受客户与合作伙伴好评。

商汤倡导“发展”的人工智能伦理观,并积极参与有关数据安全、隐私保护、人工智能伦理道德和可持续人工智能的行业、国家及国际标准的制订,与多个国内及多边机构就人工智能的可持续及伦理发展开展了密切合作。商汤《AI可持续发展道德准则》被联合国人工智能战略资源指南选录,并于2021年6月发表,是亚洲唯一获此殊荣的人工智能公司。

商汤(股票代码:0020.HK)已于香港交易所主板挂牌上市。商汤在香港、上海、北京、深圳、成都、杭州、南平、青岛、西安、台北、澳门、京都、东京、新加坡、利雅得、阿布扎比、迪拜、吉隆坡、首尔等地设立办公室。另外,商汤科技在德国、泰国、印度尼西亚、菲律宾等国家均有业务。

职位发布者:田女士

深圳市商汤科技有限公司

融资阶段:B轮

公司规模:1000~9999人

相似职位: