职位概述:
该职位主要聚焦于神经网络处理器(NPU)硬件架构设计以及性能、功耗、面积(PPA)优化工作,需要任职者深度参与关键模块性能分析,提出架构优化方案,并完成相应架构及微架构规格制定,通过与多方团队协作来推动 NPU 产品的优化与完善,使其能更好地满足人工智能相关应用需求。
岗位职责
1、硬件架构设计与优化
1)全面负责 NPU 硬件架构设计以及 PPA 优化工作,依据产品目标和应用场景需求,从整体架构层面规划 NPU 的功能模块布局、数据通路等关键要素,同时运用专业知识与经验持续对其性能、功耗、面积等方面进行优化改进,提升 NPU 的综合竞争力。
2)针对关键模块展开深入的性能分析,基于分析结果生成架构优化解决方案,并详细完成架构与微架构规格说明文档的编制,为后续的硬件开发、验证等环节提供清晰准确的指导依据。
2、创新方案提出与验证
与架构师团队紧密合作,结合业务需求和技术发展趋势,提出创新性的硬件解决方案,并通过开发各类模型来对这些方案进行有效性验证,确保创新方案在实际应用中切实可行,能够为 NPU 带来性能提升或功能拓展等优势。
3、跨团队协作沟通
1)积极与算法团队协作,深入理解人工智能算法要求,使硬件架构设计能紧密贴合算法特点,高效支持各类 AI 算法在 NPU 上的运行,保障软硬件之间的适配性与协同性。
2)同软件团队开展合作,了解软件可编程性要求,从硬件架构层面考虑如何更好地满足软件编程与应用开发的需求,确保 NPU 能为软件层面提供友好、便捷且高效的编程接口和运行环境。
4、技能与经验要求
教育背景与工作经验:拥有硕士及以上学位,且具备至少 8 年以上的相关工作经验,积累了丰富的专业知识和项目实践经历,能够独立承担复杂的 NPU 硬件架构相关工作任务。
5、专业知识技能:
1)精通计算架构,对 NPU、CPU、通用图形处理器(GPGPU)的架构及微架构有全面深入的理解,能够基于这些知识开展高性能、高质量的 NPU 硬件架构设计工作,并与其他相关计算架构进行有效的协同与对比分析。
2)熟悉机器学习网络、框架以及 AI 软件栈相关知识,了解不同 AI 算法和软件在硬件层面的运行机制与需求,以便更好地优化 NPU 架构来适配各类 AI 应用场景。
3)在内存层次结构与缓存、总线与片上网络(NoC)、处理器流水线等领域具备架构 / 微架构设计经验,能针对这些关键硬件模块进行合理设计与优化,提升整个 NPU 系统的性能与效率。
4)熟练掌握芯片 PPA 优化技术,且拥有自主研发芯片量产的相关经验,了解从芯片设计到量产过程中的关键环节与优化要点,能够确保所设计的 NPU 在实际量产时满足各项性能、成本等指标要求。
5)掌握硬件描述语言(HW/RTL)以及 SystemC 相关知识,可运用这些工具进行硬件架构的建模、设计与分析等工作,辅助实现高效准确的 NPU 架构设计与优化。
6)综合能力素质:具备较强的学习能力,能紧跟行业内快速发展的 AI 及芯片技术动态,及时更新自身知识体系;同时拥有出色的团队沟通能力,可在跨部门、跨专业团队合作中准确传达想法、理解他人需求,共同推动项目顺利开展。