大模型训练推理计算专家

DevTech专家-GPU Computing

工作职责

DevTech GPU Computing团队主要负责把高效的算法方案应用到客户场景上,工作内容包括但不限于:

• 了解AI主流的算法模型,在GPU上进行稳定高性能地部署应用

• 针对重要应用场景,打造领域解决方案和SDK

• 与关键客户直接合作,了解他们当前和未来面临的问题,并提供基于GPU的理想解决方案

• 和内部的架构,加速库,工具和系统软件等团队紧密合作,影响下一代架构和软件平台的设计

• 贡献技术内容到开发者网站/技术Blog等,参与业界顶尖的会议/论坛并发挥影响力

任职资格

• CS/EE相关专业的硕士及以上学历,5年以上相关经验

• 有良好的C++/python编程能力,对CUDA编程有实战经验,对GPU架构有了解

• 在以下至少一个方向有深入的研发经验和优秀的工作成果

○ 大模型训练:熟悉Megatron/DeepSeed/Pytorch等,在GPU适配及大模型性能调优等有实战

○ 大模型推理服务:熟悉Vllm/TensorRT/Triton等推理服务引擎,使用Triton优化融合算子,在领域模型的优化部署上有经验

○ HPC:熟悉MPI/OpenMP,在VASP/LAPACK等加速上有经验

• 具备很好的学习能力和良好的沟通组织能力,逻辑性强,善于发现并解决问题,具备优先级排序能力

优先条件

• 在ICPP/ISC/HPDC等会议上有发表过论文

• 在ACM/Kaggle/数学建模等竞赛上有优异的名次

•在重要的行业论坛上进行过技术分享

公司地点:上海浦东新区长泰广场B座12楼

公司简介:

职位发布者:薛经理

摩尔线程智能科技(北京)股份有限公司

融资阶段:

公司规模:

相似职位: