岗位职责:
1. 负责Linux内核核心特性开发,重点优化GPU资源调度算法及异构计算架构,针对大模型训练/推理场景设计内核级GPU加速方案,实现计算、显存、IO的极致性能优化;
2. 承担GPU相关子系统(驱动管理、显存分配、PCIe/NVLink数据传输)的技术攻坚,解决大规模分布式训练中的内核瓶颈问题,优化GPU集群通信效率;
3. 主导GPU虚拟化技术研发,包括vGPU、MIG多实例等方案在内核层的实现与优化,提升云平台GPU资源利用率;
任职资格:
1.本科及以上学历,计算机体系相关知识扎实,精通Linux内核,开发经验丰富;
2.深入研究过GPU子系统架构,熟悉NVIDIA CUDA/AMD ROCm内核交互机制,掌握GPU-Kernel协同优化方法论;
3. 熟悉Linux常用性能分析工具如 perf/ftrace/ebpf/systemtap/blktrace等,有实际的系统级性能优化经验优先;
4.精通NVIDIA/AMD GPU硬件架构及CUDA/ROCm软件栈,具备大模型场景下的性能调优经验,包括但不限于:
- Transformer架构内核级优化
- 显存高效分配与碎片整理
- 分布式训练通信优化(NCCL/RCcl)
- 混合精度计算加速
- GPU-CPU异构流水线设计
5. 熟悉GPU虚拟化技术(vGPU/MIG/SR-IOV),具备Kubernetes GPU调度器开发或容器GPU隔离优化经验者优先
6. 掌握Nsight/rocProfiler等GPU专用分析工具,能进行CUDA Kernel指令级优化与PCIe带宽瓶颈分析
7. 有PyTorch/TensorFlow等框架底层优化经验,熟悉大模型训练基础设施架构设计者优先
UCloud (优刻得科技股份有限公司)是中立、安全的云计算服务平台,坚持中立,不涉足客户业务领域。公司自主研发IaaS、PaaS、大数据流通平台、AI服务平台等一系列云计算产品,并深入了解互联网、传统企业在不同场景下的业务需求,提供公有云、混合云、私有云、专有云在内的综合性行业解决方案。