AI Infra-高性能计算

职业描述

1、深度参与图像生成、视频生成、多模态视觉理解等视觉大模型训推一体化平台建设；

2、负责视觉大模型训练优化算法研究和落地，通过5D并行、通信优化、AutoCheckpointing等分布式训练手段提升模型的训练速度与效率；

3、通过编译优化、模型并行优化、图融合、高性能算子开发、低精度计算、Memory复用、Cache优化、高并发服务请求优化等技术，打造业界领先的高性能大模型训推引擎；

4、与算法部门深度合作，分析性能瓶颈，通过软硬结合提升模型训推效率，优化和部署视觉大模型，支持AI工具链和技术生态建设，推动 AI 关键业务发展。

职位要求

1、本科及以上学历，计算机/电子/信息/通信/自动化/软件等相关专业；

2、熟练掌握Linux环境下的C/C++、Python语言；

3、有良好的数据结构和算法基础，了解主流LLM/VLM/SD等模型，有高性能优化相关工作经验优先；

4、能够熟练使用至少一种主流的机器学习框架，熟悉Pytorch、FSDP、DeepSpeed、Megatron等分布式训练框架，有研究和相关开发经验者优先；

5、熟悉主流高性能并行编程技术，有GPU编程经验（CUDA或Triton) ，有TensorRT/Cutlass开发经验，熟悉TRTLLM、VLLM等至少一种推理框架、熟悉昇腾卡/CANN 等经验者优先；

6、有较为深入的TVM/MLIR/XLA/PTX等自动化编译技术，有Memory/Cache优化、量化/稀疏等模型优化经验优先。

公司地点：上海徐汇区国际传媒港wework