深度学习框架研发工程师

工作职责

- 负责端侧高性能AI推理框架开发,充分挖掘后端硬件的算力,构建业界性能领先的AI框架

- 适配小爱同学各业务算法模型,落地到各种端侧设备上,包含车、手机、IoT设备等

- 负责端侧大模型推理套件开发,优化推理性能,打造智能小爱

- 负责业界AI框架技术跟踪调研,以及学术界技术落地可行性分析

岗位要求

- 熟悉业界开源框架设计实现,包含TFLite、MNN、MindSpore Lite、TVM等,具有框架开发经验更佳

- 熟悉自然语言模型结构,具备模型部署的调试调优能力,了解各种量化、剪枝、稀疏压缩等模型小型化技术,以及算子融合、图优化、访存优化等优化技术

- 熟悉常见开源大模型Llama2、Mistral、Gemma、MoE等模型结构,以及KVCache、PageAttention、FlashAttention、ContinueBatch、Medusa、Eagel等推理优化技术,具有端侧大模型端侧部署经验

- 熟悉CPU、GPU等通用硬件架构,以及相应指令集和算子库,了解一款主流NPU硬件架构和工具链,比如HTP、APU等

- 具备扎实的C++和Python的编程基础,有丰富的编程经验者优先

- 具有较强的学习和解决问题的能力,拥有良好的团队合作和沟通能力

公司地点:北京海淀区小米科技园(南门)NA

公司简介:

小米集团成立于2010年4月,2018年7月9日在香港交易所主板挂牌上市(1810.HK),是一家以智能手机、智能硬件和IoT平台为核心的消费电子及智能制造公司。

胸怀“和用户交朋友,做用户心中最酷的公司”的愿景,小米致力于持续创新,不断追求极致的产品服务体验和公司运营效率,努力践行“始终坚持做感动人心、价格厚道的好产品,让全球每个人都能享受科技带来的美好生活”的公司使命。

小米目前是全球领先的智能手机品牌之一,同时,小米已经建立起全球领先的消费级AIoT物联网平台,截至2021年9月30日,AIoT平台已连接的IoT设备(不包括智能手机及笔记本电脑和平板)数突破4亿。集团业务已进入全球逾100个国家和地区。2021年8月,小米集团连续三年进入《财富》2021年「世界500强排行榜」 (Fortune Global 500) ,位列338名,较2020年大幅提升84位。

小米集团目前为恒生指数、恒生中国企业指数、恒生科技指数及恒生神州50指数成份股。

职位发布者:吴女士

北京小米移动软件有限公司

融资阶段:

公司规模:1000~9999人

相似职位: