主要职责:
1. 与算法研究员合作, 共同完成先进的计算机视觉算法在嵌入式平台的落地, 在性能/内存/功耗等关键工程指标达到世界优秀水平.
2. 深入参与算法研发的全生命周期, 从早期效果论证开始介入, 直到最终量产落地
3. 协助研究员进行算法的计算热点分析, 算法优化, 以及后续的工程实现
4. 开发和维护自研的CV算子基础库, 以及对应的性能/功耗/内存自动搜索系统
岗位要求:
1. 精通C++, 精通异步编程
2. 精通任意一种微架构, 包括X86/ARM CPU, 高通/Mali GPU, VLEW架构的DSP等.
3. 精通任意一种体系结构的memory hirechrey, 以及常见的memory access pattern优化方法
4. 精通常见的cv kernel原理与优化方法, 有手动编写常见fusion kernel能力
5. 精通常见的BLAS kernel, 有手动实现kernel, 以及pipeline指令集优化经验
6. 能够基于roofline model进行hardware/kernel瓶颈分析, 有实际量化分析和优化经验者尤佳
7. 熟悉同步集成电路功耗原理及常用优化手段, 对微架构和功耗之间的关系有深刻认识, 有分析和优化经验者尤佳.
8. 极强的调试能力和抽象思维能力
9. 追求极致, 愿意死磕技术难题, 对性能优化/量化分析有执着的追求