职位描述
1. 负责AI异构计算软件栈的研发,结合不同加速芯片的特性,实现对AI计算的全链路优化,参与打造业界领先的高可靠,高性能,高效率的大规模AI算力基础设施;
2. 结合业务场景,通过软硬件协同优化和技术创新(包括但不限于算子优化与编译,系统调度,分布式推理优化等工程课题),为实际业务提供极致的性能和成本;
3. 洞悉人工智能及深度学习的应用发展趋势,参与下一代AI基础设施的设计与研发。
职位要求
1. 具备扎实的工程能力 (C++,Python等);
2.对GPU(或相关AI加速芯片)系统结构有深入的理解,有实际的开发和优化经验;
3. 熟悉主流深度学习框架(例如PyTorch),并对底层实现有一定了解,在模型训练或推理性能优化方面有实操经验;
4. 了解主流大模型的结构与执行细节,了解相关的推理性能优化技术;
5. 具备良好的沟通协作能力和项目组织能力,能与不同背景的团队有效沟通,合作,并对项目进行一定的组织与规划,以确保项目按时按质按量完成;
拥有以下经验者优先
a. 熟悉主流GPU算子优化工具(Cutlass/Triton)和性能分析工具;
b. 有深度学习框架开发经验,如Tensorflow,PyTorch等;
c. 有异构计算、编译等领域开发经验;
d. 有高性能分布式计算相关经验;