AI Infra-高性能计算

职业描述

1、深度参与图像生成、视频生成、多模态视觉理解等视觉大模型训推一体化平台建设;

2、负责视觉大模型训练优化算法研究和落地,通过5D并行、通信优化、AutoCheckpointing等分布式训练手段提升模型的训练速度与效率;

3、通过编译优化、模型并行优化、图融合、高性能算子开发、低精度计算、Memory复用、Cache优化、高并发服务请求优化等技术,打造业界领先的高性能大模型训推引擎;

4、与算法部门深度合作,分析性能瓶颈,通过软硬结合提升模型训推效率,优化和部署视觉大模型,支持AI工具链和技术生态建设,推动 AI 关键业务发展。

职位要求

1、本科及以上学历,计算机/电子/信息/通信/自动化/软件等相关专业;

2、熟练掌握Linux环境下的C/C++、Python语言;

3、有良好的数据结构和算法基础,了解主流LLM/VLM/SD等模型,有高性能优化相关工作经验优先;

4、能够熟练使用至少一种主流的机器学习框架,熟悉Pytorch、FSDP、DeepSpeed、Megatron等分布式训练框架,有研究和相关开发经验者优先;

5、熟悉主流高性能并行编程技术,有GPU编程经验(CUDA或Triton) ,有TensorRT/Cutlass开发经验,熟悉TRTLLM、VLLM等至少一种推理框架、熟悉昇腾卡/CANN 等经验者优先;

6、有较为深入的TVM/MLIR/XLA/PTX等自动化编译技术,有Memory/Cache优化、量化/稀疏等模型优化经验优先。

公司地点:上海徐汇区国际传媒港wework

公司简介:

职位发布者:程女士

中国电信股份有限公司人工智能研究院(上海)

融资阶段:

公司规模:

相似职位: