高性能计算工程师（上海）

岗位职责

1. 参与基于GPU的高性能计算（HPC）项目设计与开发，负责GPU芯片（NVIDIA/AMD等）的底层性能优化与调优。

2. 针对大模型推理、训练等场景，优化和扩展vLLM、SGLang等框架的核心模块，提升计算效率与资源利用率。

3. 深入分析GPU硬件架构特性（如Tensor Core、显存带宽、通信机制等），设计并实现高性能算子与算法。

4. 与算法训练团队协作，解决分布式推理下模型并行（Model Parallelism）、数据并行（Data Parallelism）等场景下的性能瓶颈问题。

5. 探索前沿技术方向（如混合专家模型MoE、动态计算图优化等），推动AI工程化落地的效率提升。

岗位要求：

1. 精通CUDA/OpenCL等GPU编程语言，熟悉NVIDIA或AMD的底层优化技巧。

2. 熟悉vLLM、SGLang等大模型推理框架，有实际性能调优经验（如KV Cache优化、动态批处理、Attention算子定制等）。

3. 扎实的高性能计算基础，熟悉并行计算、内存优化、通信优化等技术。

4. 熟练使用C/C++、Python，具备良好的算法设计与代码实现能力。

5. 经验要求：2年以上GPU高性能计算开发经验，有大规模AI模型优化经验者优先。

【优先条件】

* 熟悉DeepSeek系列模型的工程优化技术，包括但不限于PD分离、MLA、MOE负载均衡、MTP等。

* 有TensorRT、vLLM、SGLang、Triton Inference Server、MLIR/LLVM等编译优化工具链的实际项目经验。

公司地点：上海徐汇区上海腾讯大厦1

腾讯以技术丰富互联网用户的生活。

通过通信及社交平台微信和 QQ 促进用户联系，并助其连接数字内容和生活服务，尽在弹指间。

通过高效广告平台，协助品牌和市场营销者触达数以亿计的中国消费者。

通过金融科技及企业服务，促进合作伙伴业务发展，助力实现数字化升级。

我们大力投资于人才队伍和推动科技创新，积极参与互联网行业协同发展。

腾讯于 1998 年11月在中国深圳成立，2004 年6月在香港联合交易所主板上市。