Ai infra

优先级顺序

第一批#TOP5学校博士刚毕业或者类似ACM金等其他奖金牌得主像或者阿里星、华为天才少年、腾讯大咖

第二批#幻方、阿里通义千问、华为盘古、腾讯混元、百度文心一言、字节跳动云雀等

第三批#创业公司minimax、月之暗面、深言科技、零一万物等

ACM等金牌或者其他大奖,CV求质不求量,只看第一作者有行业影响力。C9以上的候选人

职位描述

1、负责开发和优化公司大模型AI推理框架,通过CPU/GPU/DSP/NPU的并行计算优化、架构设计、稀疏优化、异构调度等多种高性能优化技术打造业界领先的高性能异构AI推理引擎;

2、负责将CV、Audio、NLP等方向深度学习算法在移动端/服务端/PC端做全链路部署优化,落地到核心产品,支撑AI方向核心业务的发展;

3、负责AIGC、AI编译优化、端上训练等核心技术开发与优化;

4、负责AI工具链开发及技术生态的建设,包括但不限于不同芯片的性能瓶颈分析与优化指引工具、模型图优化工具、可视化工具等。

职位要求

1、C9硕士及以上学历,计算机/电子/信息/通信/自动化/软件等相关专业,有AI工程优化经验的优先;

2、精通C/C++,精通算法与数据结构,熟悉Python;

3、熟练掌握CPU(ARM/x86),GPU(Adreno/Mali/PowerVR/Intel/Nvidia/Apple)、DSP(HVX)中的1个或多个平台的高性能计算优化技术,深入理解计算机体系结构,熟悉移动端/服务端/PC端中1个或多个平台的并行计算优化、访存优化,低比特计算等;

4、具备丰富的ARM NEON汇编优化或OpenCL/Metal/OpenGL/Vulkan/CUDA中的至少1种GPU优化经验,或熟练掌握WebAssembly、WebGL、WebGPU等技术,有这些技术的AI工程优化部署经验者优先;

5、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架及其模型文件的解析,如Pytorch、Tensorflow;

6、熟悉常用图像视觉计算库及深度学习推理计算库,例如arm compute library、tensorflow lite、ncnn、mnn、tnn、mkldnn、TensorRT、CoreML等,熟悉常用的深度学习算子优化方法例如Winograd, Strassen, Implicit GEMM等;

7、掌握AI编译优化技术,例如TVM/MLIR/IREE等;

8、了解主流 AIGC 算法模型原理,有AIGC模型加速优化经验者优先。

公司地点:上海互联宝地

公司简介:

职位发布者:卞俊豪

上海聿贵企业管理咨询有限公司

融资阶段:不需要融资

公司规模:

相似职位: