岗位职责
1. 参与基于GPU的高性能计算(HPC)项目设计与开发,负责GPU芯片(NVIDIA/AMD等)的底层性能优化与调优。
2. 针对大模型推理、训练等场景,优化和扩展vLLM、SGLang等框架的核心模块,提升计算效率与资源利用率。
3. 深入分析GPU硬件架构特性(如Tensor Core、显存带宽、通信机制等),设计并实现高性能算子与算法。
4. 与算法训练团队协作,解决分布式推理下模型并行(Model Parallelism)、数据并行(Data Parallelism)等场景下的性能瓶颈问题。
5. 探索前沿技术方向(如混合专家模型MoE、动态计算图优化等),推动AI工程化落地的效率提升。
岗位要求:
1. 精通CUDA/OpenCL等GPU编程语言,熟悉NVIDIA或AMD的底层优化技巧。
2. 熟悉vLLM、SGLang等大模型推理框架,有实际性能调优经验(如KV Cache优化、动态批处理、Attention算子定制等)。
3. 扎实的高性能计算基础,熟悉并行计算、内存优化、通信优化等技术。
4. 熟练使用C/C++、Python,具备良好的算法设计与代码实现能力。
5. 经验要求:2年以上GPU高性能计算开发经验,有大规模AI模型优化经验者优先。
【优先条件】
* 熟悉DeepSeek系列模型的工程优化技术,包括但不限于PD分离、MLA、MOE负载均衡、MTP等。
* 有TensorRT、vLLM、SGLang、Triton Inference Server、MLIR/LLVM等编译优化工具链的实际项目经验。
腾讯以技术丰富互联网用户的生活。
通过通信及社交平台微信和 QQ 促进用户联系,并助其连接数字内容和生活服务,尽在弹指间。
通过高效广告平台,协助品牌和市场营销者触达数以亿计的中国消费者。
通过金融科技及企业服务,促进合作伙伴业务发展,助力实现数字化升级。
我们大力投资于人才队伍和推动科技创新,积极参与互联网行业协同发展。
腾讯于 1998 年11月在中国深圳成立,2004 年6月在香港联合交易所主板上市。