模型推理/训练优化

岗位职责:

1、负责开发和优化公司级的AIGC推理框架,通过编译优化、并行计算优化、图融合、高效 CUDA 算子开发、低精度计算、高并发服务请求优化等高性能优化技术打造业界领先的 AIGC 推理引擎;

2、负责 AIGC训练优化算法研究和落地,通过数据并行、模型并行、Pipeline并行、通信优化等基于 CUDA 的分布式训练框架大幅提升模型的训练速度与效率;

3、与公司各算法部门深度合作,分析业务性能瓶颈,通过软硬结合的方式,高效部署与优化AIGC核心业务模型,落地到字节各产品线,投入AI工具链开发及技术生态的建设,支撑字节AI方向重要业务的发展;

职位要求

1、本科及以上学历,计算机/电子/信息/通信/自动化/软件等相关专业;

2、熟练掌握Linux环境下的C/C++、Python语言;

3、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,1 年以上 AutoML、模型推理/训练优化或AI 相关工作经验; 4、能够熟练使用至少一种主流的机器学习框架,熟悉各种模型/数据并行训练框架优先;

5、了解主流 AIGC 算法模型,有 AIGC 模型推理和训练加速落地经验者优先;

6、有 CUDA 开发经验,熟悉TensorRT/Triton/Cutlass经验者优先;

7、有大模型训练优化经验,熟悉FSDP/DeepSpeed/Megatron等分布式训练框架经验者优先。

公司地点:北京望京SOHO

公司简介:

职位发布者:卞俊豪

上海聿贵企业管理咨询有限公司

融资阶段:不需要融资

公司规模:

相似职位: