主要职责:
1.智能客服系统开发:
设计并实现基于自然语言处理(NLP)的智能客服系统,支持多轮对话、意图识别、情感分析等功能。
优化对话管理模块,提升客服系统的响应速度和准确性。
集成语音识别(ASR)和语音合成(TTS)技术,支持语音交互功能
2.大语言模型(LLM)应用:
基于大语言模型(如GPT、BERT等)开发定制化应用,提升智能客服的语义理解和生成能力。
针对垂直领域进行模型微调,优化模型在特定场景下的表现。
探索大模型在知识问答、内容生成等场景中的应用。
3.知识库构建与优化:
设计并实现基于RAG(Retrieval-Augmented Generation)的知识库系统,支持高效的知识检索与生成。
优化知识库的检索算法,提升检索效率和准确性。
结合业务需求,持续更新和扩展知识库内容。
4.推理服务开发:
使用 Triton Inference Server 部署和优化深度学习模型,支持高并发、低延迟的推理服务。
配置和管理Triton Server的模型仓库,支持多模型、多版本的动态加载和切换。
优化Triton Server的性能,包括模型批处理(batching)、动态批处理(dynamic batching)和硬件加速(如GPU、TPU)的使用。
监控和调试推理服务的性能,确保服务的高可用性和稳定性。
5.技术研究与创新:
跟踪AI领域的最新进展,探索新技术在智能客服和知识库中的应用。
参与技术方案的设计与评审,推动团队技术能力的提升。
任职要求:
1.计算机科学、人工智能、机器学习、数据科学或相关领域的本科及以上学历。
2.熟练掌握Python、C++等编程语言,熟悉主流深度学习框架(如TensorFlow、PyTorch等)。
3.具备自然语言处理(NLP)相关经验,熟悉BERT、GPT等大语言模型。
4.熟悉知识图谱、RAG技术及相关工具(如FAISS、Elasticsearch等)。
5.有 Triton Inference Server 的实际使用经验,熟悉其架构、配置和优化方法。
6.了解模型部署和推理优化的相关技术,如模型量化、剪枝、ONNX转换等。
7.有智能客服系统开发经验者优先,有大语言模型微调或应用经验者优先,有知识库构建与优化经验者优先,有Triton Server或其他推理框架的实际项目经验者优先。