AI大模型GPU内核性能优化专家

岗位职责:

1. 负责Linux内核核心特性开发,重点优化GPU资源调度算法及异构计算架构,针对大模型训练/推理场景设计内核级GPU加速方案,实现计算、显存、IO的极致性能优化;

2. 承担GPU相关子系统(驱动管理、显存分配、PCIe/NVLink数据传输)的技术攻坚,解决大规模分布式训练中的内核瓶颈问题,优化GPU集群通信效率;

3. 主导GPU虚拟化技术研发,包括vGPU、MIG多实例等方案在内核层的实现与优化,提升云平台GPU资源利用率;

任职资格:

1.本科及以上学历,计算机体系相关知识扎实,精通Linux内核,开发经验丰富;

2.深入研究过GPU子系统架构,熟悉NVIDIA CUDA/AMD ROCm内核交互机制,掌握GPU-Kernel协同优化方法论;

3. 熟悉Linux常用性能分析工具如 perf/ftrace/ebpf/systemtap/blktrace等,有实际的系统级性能优化经验优先;

4.精通NVIDIA/AMD GPU硬件架构及CUDA/ROCm软件栈,具备大模型场景下的性能调优经验,包括但不限于:

- Transformer架构内核级优化

- 显存高效分配与碎片整理

- 分布式训练通信优化(NCCL/RCcl)

- 混合精度计算加速

- GPU-CPU异构流水线设计

5. 熟悉GPU虚拟化技术(vGPU/MIG/SR-IOV),具备Kubernetes GPU调度器开发或容器GPU隔离优化经验者优先

6. 掌握Nsight/rocProfiler等GPU专用分析工具,能进行CUDA Kernel指令级优化与PCIe带宽瓶颈分析

7. 有PyTorch/TensorFlow等框架底层优化经验,熟悉大模型训练基础设施架构设计者优先

公司地点:上海杨浦区隆昌路(地铁站)城市概念10号楼B座

公司简介:

UCloud (优刻得科技股份有限公司)是中立、安全的云计算服务平台,坚持中立,不涉足客户业务领域。公司自主研发IaaS、PaaS、大数据流通平台、AI服务平台等一系列云计算产品,并深入了解互联网、传统企业在不同场景下的业务需求,提供公有云、混合云、私有云、专有云在内的综合性行业解决方案。

职位发布者:胡先生

优刻得科技股份有限公司

融资阶段:

公司规模:100~499人

相似职位: