大模型训练和推理框架负责人

职位描述

1. 负责大语言模型训练框架开发和优化,包括不限于性能分析,高性能算子,计算和通信优化,可观测性等

2. 负责大语言模型推理框架开发和优化,包括不限于PD分离,专家并行,高性能算子等

3. 负责训练和推理框架团队管理和规划,支持上层大语言和多模态模型的训练和推理

职位要求

1. 计算机/电子/数学等相关专业硕士及以上学历, 8年以上计算机相关工作经验,3年以上团队管理经验

2. 编程能力 :精通C/C++,熟悉Python,具备扎实的数据结构与算法基础

3. GPU与CUDA :熟悉NVIDIA GPU架构及编程模型,掌握CUDA核函数优化、显存管理、多流并发等技术,有实际性能调优经验

4. 熟悉PyTorch、Megatron、vLLM/SGLang等深度学习训练和推理框架, 有分布式系统开发经验

5. 熟悉常用大语言模型,多模型以及生成模型等算法和架构,参与过大模型训练/推理项目

公司地点:北京海淀区元中心14号楼14号楼

公司简介:

小米集团成立于2010年4月,2018年7月9日在香港交易所主板挂牌上市(1810.HK),是一家以智能手机、智能硬件和IoT平台为核心的消费电子及智能制造公司。

胸怀“和用户交朋友,做用户心中最酷的公司”的愿景,小米致力于持续创新,不断追求极致的产品服务体验和公司运营效率,努力践行“始终坚持做感动人心、价格厚道的好产品,让全球每个人都能享受科技带来的美好生活”的公司使命。

小米目前是全球领先的智能手机品牌之一,同时,小米已经建立起全球领先的消费级AIoT物联网平台,截至2021年9月30日,AIoT平台已连接的IoT设备(不包括智能手机及笔记本电脑和平板)数突破4亿。集团业务已进入全球逾100个国家和地区。2021年8月,小米集团连续三年进入《财富》2021年「世界500强排行榜」 (Fortune Global 500) ,位列338名,较2020年大幅提升84位。

小米集团目前为恒生指数、恒生中国企业指数、恒生科技指数及恒生神州50指数成份股。

职位发布者:吴女士

北京小米移动软件有限公司

融资阶段:

公司规模:1000~9999人

相似职位: