模型推理/训练优化

岗位职责：

1、负责开发和优化公司级的AIGC推理框架，通过编译优化、并行计算优化、图融合、高效 CUDA 算子开发、低精度计算、高并发服务请求优化等高性能优化技术打造业界领先的 AIGC 推理引擎；

2、负责 AIGC训练优化算法研究和落地，通过数据并行、模型并行、Pipeline并行、通信优化等基于 CUDA 的分布式训练框架大幅提升模型的训练速度与效率；

3、与公司各算法部门深度合作，分析业务性能瓶颈，通过软硬结合的方式，高效部署与优化AIGC核心业务模型，落地到字节各产品线，投入AI工具链开发及技术生态的建设，支撑字节AI方向重要业务的发展；

职位要求

1、本科及以上学历，计算机/电子/信息/通信/自动化/软件等相关专业；

2、熟练掌握Linux环境下的C/C++、Python语言；

3、了解深度学习算法基本原理，熟悉神经网络基本架构和各算子计算方式，1 年以上 AutoML、模型推理/训练优化或AI 相关工作经验； 4、能够熟练使用至少一种主流的机器学习框架，熟悉各种模型/数据并行训练框架优先；

5、了解主流 AIGC 算法模型，有 AIGC 模型推理和训练加速落地经验者优先；

6、有 CUDA 开发经验，熟悉TensorRT/Triton/Cutlass经验者优先；

7、有大模型训练优化经验，熟悉FSDP/DeepSpeed/Megatron等分布式训练框架经验者优先。

公司地点：北京望京SOHO