职位描述:
1.负责算法边缘部署,包括将算法部署到边缘设备上,优化算法在边缘设备上的运行效率,提高算法的响应速度和准确率
2.负责算法GPU优化,包括利用GPU加速算法运行,使用CUDA、OpenCL等GPU编程框架,优化算法在GPU上的性能,提高算法的计算速度和准确率
3.设计和实现算法的模型部署平台,优化模型在不同设备上的部署表现
4.分析和解决算法边缘部署和GPU优化过程中的问题,对算法的性能瓶颈进行优化
5.持续分析代码工程中的瓶颈(如内存泄漏、冗余计算、低效I/O),通过算法改进、数据结构优化、并行化改造等手段提升系统整体效率
6.通过算子融合、模型量化(INT8/FP16)、动态批处理等技术优化推理性能,设计多线程/分布式调度策略,提升资源利用率
职位要求:
1.本科及以上学历,计算机、电子、通信等相关专业
2.熟悉深度学习、计算机视觉、机器学习等相关领域的算法和应用
3.精通C++,熟悉多线程编程、内存管理及性能分析工具(如Perf、Valgrind),了解编译优化原理
4.有较强的算法设计和优化能力,能从算法、代码、硬件多维度提出优化方案
5.熟悉模型压缩和量化技术,熟悉模型部署工具链(TensorRT)及加速框架(CUDA)
6.具备较强的沟通和团队协作能力,能够与团队成员进行紧密合作,共同完成任务
7.具有较好的英文阅读和写作能力,能够阅读英文文献和参与英文写作