工作职责:
1、开发基于自研NPU的高性能算子
2、开发基于高性能算子的测试环境以及分析脚本_x000b_深入了解芯片计算架构, 不断优化提升神经网络算子的计算效率。
3、编写技术文档与部门内部定期交流
工作地点可选北京/上海/合肥
职位要求:
1、精通C++/Python, 熟练掌握Linux应用程序开发流程及环境。
2、熟练掌握神经网络算子计算过程,掌握多种算子性能调试方法 ,有CUDA/OpenCL编程基础优先。了解并行计算机体系结构,熟知体系结构对计算效率影响者优先。
3、熟练使用仿真工具者优先