岗位职责:
开发性能分析工具链,采集硬件性能计数器(PMC)、流水线阻塞、内存带宽、功耗等数据
构建交互式分析系统(类似VTune/Nsight),支持性能热点定位、流水线瓶颈可视化、能效分析报告生成
设计数据采集底层驱动,优化性能监控开销(如采样频率控制、内存占用压缩)
开发自动化分析脚本,关联性能数据与代码/算子,提供优化建议
任职要求:
精通C++/Python,熟悉Linux Perf、CUDA Profiler等工具链开发
深入理解计算机体系结构(缓存一致性、多核调度、内存层级)
熟悉AI芯片硬件监控模块(如PMU、DMA追踪单元)
有高性能计算分析经验(如GPU/NPU性能建模)优先