异构计算研发工程师

职位描述

● 参与以GPU等AI芯片为基础的高性能计算项目,深度分析GPU硬件体系结构,建设打磨极致的算子优化和显存优化等技术,逼近硬件理论性能峰值,突破大模型训推的显存墙,提升蚂蚁异构计算集群的硬件效率。

● 针对蚂蚁大模型训推的性能和效率等问题,持续迭代算子库、显存优化技术和工具链,构建AI系统生态。

● 持续跟踪行业前沿技术,参与开源社区的贡献。

职位要求

● 计算机相关学科专业,基本功扎实,3年以上相关工作经验。

● 熟悉Linux开发环境,掌握C/C++/Python编程语言,具备CUDA算子开发能力,掌握cutlass/CuTe/triton等算子开发工具,掌握nsys/ncu等profile工具。

● 深度理解GPU体系结构和CUDA编程模型,掌握GPU算子开发和性能调优技术,掌握GPU显存优化技术。

● 掌握FlashAttention/FlashMLA/DeepGEMM/FlashInfer等项目源码,有该加速库优化经验者优先。

● 掌握vllm/sglang/TensorRT-LLM等框架,有实际性能调优经验和开源代码贡献者优先。

● 有国产加速卡程序开发和优化经验者优先。

● 有开源贡献、系统顶会论文或者相关专利者优先。

● 有创新想法和技术攻关能力,优秀的逻辑分析和解决问题的能力,团队沟通协作能力强。

公司地点:北京海淀区蚂蚁T空间东塔

公司简介:

蚂蚁云创数字科技(北京)有限公司成立于2015年01月15日,注册地位于北京市海淀区高梁桥斜街42号院1号楼7层1-729,法定代表人为倪行军。经营范围包括一般项目:技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;软件开发;计算机系统服务;数据处理服务;专业设计服务;社会经济咨询服务;翻译服务;会议及展览服务;企业管理咨询;广告设计、代理;广告制作;广告发布;计算机软硬件及辅助设备批发;计算机软硬件及辅助设备零售;文具用品批发;文具用品零售;体育用品及器材批发;体育用品及器材零售;工艺美术品及收藏品零售(象牙及其制品除外);工艺美术品及收藏品批发(象牙及其制品除外);日用品销售;通讯设备销售;电子产品销售;服装服饰批发;服装服饰零售;办公用品销售。(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)(不得从事国家和本市产业政策禁止和限制类项目的经营活动。)

职位发布者:任先生

蚂蚁云创数字科技(北京)有限公司

融资阶段:

公司规模:1000~9999人

相似职位: