GPU算法优化工程师

职位描述:

负责在各种硬件加速平台上编写以及优化深度学习框架内相关的算子,包含卷积、 矩阵乘等,探索硬件加速相关的算子的优化以及实现。

职位要求:

1.熟悉GPU硬件, 熟悉gpu内核函数优化, 熟悉主流GPU开发语言CUDA(PTX, SASS)/OPENCL中的一种或者多种;

2.熟悉常用的卷积计算加速方法,如gemm、winograd算法等;熟悉cutlass等开源矩阵乘法的库优先。

公司地点:深圳深圳元戎启行科技有限公司深圳福田区元戎启行7-8层

公司简介:

职位发布者:黄衡

深圳元戎启行科技有限公司

融资阶段:B轮

公司规模:500~999人

相似职位: