岗位职责
1.构建国内外性能有竞争力的多模态推理引擎及服务
2.跟进行业前沿技术发展趋势,持续优化多模态推理引擎及服务性能,保障服务稳定性
3.参与相关系统文档的撰写、维护,技术评审,持续功能迭代
4.和其他技术团队协同合作,保证项目交付、上线
岗位要求
1.有扎实的计算机系统基础知识,熟练掌握Python/C++编程和Linux常用操作
2.熟悉人工智能大模型相关概念和框架,如PyTorch,HuggingFace,Transformer,LLM等,以及常见的大模型架构,如GPT、LLaMA、GLM、Qwen等
3.熟悉vLLM、TensorRT-LLM、TensorRT、FasterTransformer、ONNX等推理引擎和部署框架
4.熟悉大模型推理优化常用算法,包括但不限于GPTQ、AWQ等量化算法、稀疏化等操作
5.熟悉底层数学计算库的基本原理
6.能使用nsys等工具分析推理引擎、服务性能瓶颈,给出优化方案
7.能够快速的部署推理服务,提升推理速度,提升系统的吞吐量
8.有团队协作意识,良好的沟通能力。具备优秀的代码能力及习惯,良好的文档写作能力。
武汉人工智能研究院(简称“武智院”)是由武汉东湖新技术开发区建设的新型研发机构。武智院聚焦跨模态智能国际前沿研究方向,致力于打造全栈国产化人工智能重大基础设施平台,推动全新人工智能研发转化范式变革,是中国科学院自动化研究所以技术创新带动产业发展,加速推动人工智能创新成果规模化应用的创新平台。
武智院遵循“立足武汉、辐射湖北、服务全国”的发展方针,以多模态人工智能开源开放应用服务支撑平台为基核,汇聚国内外一流高端人才,全面推动建设以跨模态智能为核心的国内一流技术先导区、产业重要增长极和应用示范先行区,促进人工智能赋能千行百业,为武汉建设国家科技创新中心提供强大智能引擎,引领和助推武汉成为新一代人工智能技术创新和产业发展“领头雁”。