职责概述:
1.负责云端智能语音交互系统的架构设计与核心开发,覆盖 ASR、NLU、对话管理、NLG、TTS 全链路技术,推动系统智能化升级。
2.设计高可用、低延迟、可扩展的微服务架构,支持大规模并发场景,保障服务稳定性与 API 标准化。
3.主导系统性能调优,优化延迟、资源利用率与容灾能力,提升用户体验。
4.探索大语言模型(LLM)在语音对话中的融合应用,包括意图理解、上下文管理与生成优化。
5.跟进端到端语音模型(如 Whisper、Qwen-Voice)、流式交互、多模态等前沿技术,推动预研与产品落地。
6.协同算法、产品与运维团队,完成从原型验证到生产部署的端到端闭环。
任职要求:
1.计算机、人工智能或相关专业本科及以上学历,5年以上语音系统研发经验,具备大型分布式系统设计经验。
2.有智能音箱、车载助手、客服机器人等量产语音产品核心开发经验,具备从0到1落地能力者优先。
3.精通语音交互各模块(唤醒词、ASR、NLU、TTS、声纹识别)原理与工程实现,具备跨模块问题定位能力。
4.熟练掌握 Go / Python / C++ / Rust 至少一门语言,代码规范,具备模块化设计与测试意识。
熟悉 LLM 在语音场景的应用(Prompt工程、推理加速、模型蒸馏等),了解 vLLM、TensorRT-LLM、HuggingFace 等框架者优先。
5.有端到端语音模型(Whisper、HuBERT、VALL-E 等)训练、微调与部署经验者优先。
熟悉云原生技术(Kubernetes、Docker、gRPC、Prometheus),具备高并发服务部署与监控经验。
6.具备系统思维、技术领导力与跨团队协作能力,对语音AI技术有持续热情。
作为人工智能软件公司,商汤科技以“坚持原创,让AI引领人类进步”为使命,旨在持续引领人工智能前沿研究,持续打造更具拓展性更普惠的人工智能软件平台,推动经济、社会和人类的发展,并持续吸引及培养顶尖人才,共同塑造未来。
商汤科技拥有深厚的学术积累,并长期投入于原创技术研究,不断增强行业领先的多模态、多任务通用人工智能能力,涵盖感知智能、自然语言处理、决策智能、智能内容生成等关键技术领域,同时包含AI芯片、AI传感器及AI算力基础设施在内的关键能力。此外,商汤前瞻性打造新型人工智能基础设施——商汤AI大装置SenseCore,打通算力、算法和平台,并在此基础上建立“商汤日日新SenseNova”大模型及研发体系,以低成本解锁通用人工智能任务的能力,推动高效率、低成本、规模化的AI创新和落地,进而打通商业价值闭环,解决长尾应用问题,引领人工智能进入工业化发展阶段。商汤科技业务涵盖智慧商业、智慧城市、智慧生活、智能汽车四大板块,相关产品与解决方案深受客户与合作伙伴好评。
商汤倡导“发展”的人工智能伦理观,并积极参与有关数据安全、隐私保护、人工智能伦理道德和可持续人工智能的行业、国家及国际标准的制订,与多个国内及多边机构就人工智能的可持续及伦理发展开展了密切合作。商汤《AI可持续发展道德准则》被联合国人工智能战略资源指南选录,并于2021年6月发表,是亚洲唯一获此殊荣的人工智能公司。
商汤(股票代码:0020.HK)已于香港交易所主板挂牌上市。商汤在香港、上海、北京、深圳、成都、杭州、南平、青岛、西安、台北、澳门、京都、东京、新加坡、利雅得、阿布扎比、迪拜、吉隆坡、首尔等地设立办公室。另外,商汤科技在德国、泰国、印度尼西亚、菲律宾等国家均有业务。