工作职责
- 负责端侧高性能AI推理框架开发,充分挖掘后端硬件的算力,构建业界性能领先的AI框架
- 适配小爱同学各业务算法模型,落地到各种端侧设备上,包含车、手机、IoT设备等
- 负责端侧大模型推理套件开发,优化推理性能,打造智能小爱
- 负责业界AI框架技术跟踪调研,以及学术界技术落地可行性分析
岗位要求
- 熟悉业界开源框架设计实现,包含TFLite、MNN、MindSpore Lite、TVM等,具有框架开发经验更佳
- 熟悉自然语言模型结构,具备模型部署的调试调优能力,了解各种量化、剪枝、稀疏压缩等模型小型化技术,以及算子融合、图优化、访存优化等优化技术
- 熟悉常见开源大模型Llama2、Mistral、Gemma、MoE等模型结构,以及KVCache、PageAttention、FlashAttention、ContinueBatch、Medusa、Eagel等推理优化技术,具有端侧大模型端侧部署经验
- 熟悉CPU、GPU等通用硬件架构,以及相应指令集和算子库,了解一款主流NPU硬件架构和工具链,比如HTP、APU等
- 具备扎实的C++和Python的编程基础,有丰富的编程经验者优先
- 具有较强的学习和解决问题的能力,拥有良好的团队合作和沟通能力
小米集团成立于2010年4月,2018年7月9日在香港交易所主板挂牌上市(1810.HK),是一家以智能手机、智能硬件和IoT平台为核心的消费电子及智能制造公司。
胸怀“和用户交朋友,做用户心中最酷的公司”的愿景,小米致力于持续创新,不断追求极致的产品服务体验和公司运营效率,努力践行“始终坚持做感动人心、价格厚道的好产品,让全球每个人都能享受科技带来的美好生活”的公司使命。
小米目前是全球领先的智能手机品牌之一,同时,小米已经建立起全球领先的消费级AIoT物联网平台,截至2021年9月30日,AIoT平台已连接的IoT设备(不包括智能手机及笔记本电脑和平板)数突破4亿。集团业务已进入全球逾100个国家和地区。2021年8月,小米集团连续三年进入《财富》2021年「世界500强排行榜」 (Fortune Global 500) ,位列338名,较2020年大幅提升84位。
小米集团目前为恒生指数、恒生中国企业指数、恒生科技指数及恒生神州50指数成份股。