AI异构软硬件结合研发专家

职位描述

1. 负责AI异构计算软件栈的研发，结合不同加速芯片的特性，实现对AI计算的全链路优化，参与打造业界领先的高可靠，高性能，高效率的大规模AI算力基础设施；

2. 结合业务场景，通过软硬件协同优化和技术创新（包括但不限于算子优化与编译，系统调度，分布式推理优化等工程课题），为实际业务提供极致的性能和成本；

3. 洞悉人工智能及深度学习的应用发展趋势，参与下一代AI基础设施的设计与研发。

职位要求

1. 具备扎实的工程能力（C++，Python等)；

2.对GPU（或相关AI加速芯片）系统结构有深入的理解，有实际的开发和优化经验；

3. 熟悉主流深度学习框架(例如PyTorch)，并对底层实现有一定了解，在模型训练或推理性能优化方面有实操经验；

4. 了解主流大模型的结构与执行细节，了解相关的推理性能优化技术；

5. 具备良好的沟通协作能力和项目组织能力，能与不同背景的团队有效沟通，合作，并对项目进行一定的组织与规划，以确保项目按时按质按量完成；

拥有以下经验者优先

a. 熟悉主流GPU算子优化工具（Cutlass/Triton）和性能分析工具；

b. 有深度学习框架开发经验，如Tensorflow，PyTorch等；

c. 有异构计算、编译等领域开发经验；

d. 有高性能分布式计算相关经验；

公司地点：深圳7-ELEVEn(阿里大厦7278店)深圳南山区阿里中心.深圳后海T3座1