智能信息-多模态推理加速工程-广州/杭州

1、支持业务多模态模型推理部署的需求

2、参与多模态大模型推理引擎的研发,挑战超大规模在线集群的极致延迟/吞吐性能优化,提供业界先进的软硬一体优化方案

职位描述

1. 精通C/C++、Python编程语言,以及Linux下的系统开发经验

2. 熟悉常用机器学习算法,对文本/多模态大模型相关领域模型,有极佳的工程实现能力,熟悉常见的多模态模型结构和pipeline
4. 熟练使用包括vllm/sglang/tgi/tensorrtLLM/lmdeploy等一种以上模型推理服务框架,有代码分析及开发实践经验优先;深入了解模型量化、蒸馏、剪枝、投机采样等模型优化原理和策略者优先

5. 对于GPU/ASIC芯片等熟悉了解硬件系统架构,能够针对性的编写高性能的算子实现,有分析及调优能力者优先,有低bit(fp8)训练和推理算子开发和应用经验者优先

6. 有语音TTS/ASR(QwenAudio/Cosyvoice),图像理解(QwenVL)、以及生图/视频(SD/Flux/Wan等)模型推理优化经验者优先

6. 在多模态推理加速相关领域的研究成果发表者/开源贡献者优先

同时我们还希望你

1、学习能力强,有良好的英文论文阅读能力,对新事物保有好奇心,并能快速适应新环境;

2、良好的沟通能力和团队协同能力;能与他人合作,共同完成目标;

3、对大模型领域有技术热情和技术追求,相信方法总比困难多,善于独立思考并反思总结。

公司地点:杭州余杭区阿里巴巴西溪C区文一西路

公司简介:

2021年4月,阿里巴巴集团成立智能信息事业群,包含夸克事业部、UC事业部、书旗事业部、智能营销平台等业务版块,核心产品为夸克App、UC浏览器、书旗小说、超级汇川广告平台等。

近两年,智能信息事业群孵化的智能搜索App夸克获得快速成长,UC浏览器、书旗小说等产品持续进化,在信息服务领域取得了不同维度的突破。智能信息事业群将集中业务资源和组织优势,聚焦智能信息服务赛道的创新机会,从用户需求出发,探索AI技术的创新应用,以“智能工具+内容”的新模式,从工具产品升级到服务平台,持续为用户提供高效、智能的互联网产品。

2021年8月至今,吴嘉担任智能信息事业群总裁。

职位发布者:何经理

优视科技(中国)有限公司

融资阶段:

公司规模:100~499人

相似职位: