此岗位招聘3个方向,CV多模态、NLP、语音。具体要求如下:
一、CV多模态方向:
岗位职责:
1. 负责图片搜索、视频搜索、图文匹配等多模态检索系统的研发与优化;
2. 结合文本、图像、视频等多模态信息,构建跨模态理解与检索模型;
3. 构建高质量的训练数据集,完成模型训练、评估与部署;
任职资格:
1. 5年以上计算机视觉或机器学习相关经验,具备多模态项目背景;
2. 熟悉图像/视频检索、图文匹配(如CLIP)、对比学习、特征向量召回等技术;
3. 熟练掌握深度学习框架(如PyTorch、TensorFlow)及常用CV工具链;具备良好的编程能力(Python/C++等),有大规模检索系统开发经验者优先;
4. 具备模型蒸馏、量化、加速(如LoRA、Prompt Tuning)等优化经验者优先;
5. 具备良好的沟通能力和团队合作精神,能够承担一定的工作压力。
二、NLP大模型方向:
岗位职责:
1. 负责AI助手相关大模型的研发与优化,包括但不限于文本问答、意图理解、对话生成等;
2. 负责大规模语言模型的训练、微调、压缩及部署,提升模型效果与推理效率;
3. 构建高质量训练数据,持续优化模型性能与用户体验;
任职资格:
1. 5年以上NLP相关经验,有大模型(如LLaMA、Qwen, ChatGLM等)实战经验;
2. 熟悉主流深度学习框架(如PyTorch、TensorFlow),具备良好的工程实现能力;
3. 熟悉文本生成、对话系统、信息抽取、语义匹配等技术;有AI助手、智能客服、问答系统等项目经验者优先;
4. 具备模型蒸馏、量化、加速(如LoRA、Prompt Tuning)等优化经验者优先;
5. 具备良好的沟通能力和团队合作精神,能够承担一定的工作压力.
三、语音方向:
岗位职责:
1. 负责语音识别系统研发与优化,提升识别准确率、响应速度及多场景适应能力;
2. 持续跟进语音识别前沿技术(如端到端模型、自监督学习、个性化适配等),并推动在产品中的落地应用;
3. 参与构建和维护语音数据标注体系,进行数据清洗、训练、评估全流程管理;
任职资格:
1. 5年以上语音识别相关领域工作经验 ,有ASR系统实际落地经验,熟悉主流语音识别框架(如Kaldi、DeepSpeech、Wav2Vec2、Whisper等);
2. 熟悉语音信号处理技术,包括但不限于语音增强、噪声抑制、回声消除、VAD等;
3. 精通Python/C++中至少一种语言,具备良好的算法实现能力;熟悉深度学习框架(如PyTorch/TensorFlow),有端到端语音识别模型开发经验者优先;
4. 对语音识别在嵌入式/低资源设备上的部署有一定了解,有模型压缩、量化、推理优化经验者优先;
5. 具备良好的沟通能力和团队合作精神,能够承担一定的工作压力.