职位描述
1. 紧跟学界业界新技术动态,为AI芯片设计开发高性能计算加速软件,包括但不限于注意力机制性能优化、MOE架构性能优化、大模型推理量化技术开发;
2. 针对大语言模型、视频生成模型训练、推理场景,基于硬件特性进行极致性能优化,包括算法和高性能算子开发,适配主流框架;
3. 和其他团队紧密合作,参与并影响芯片架构、编程模型和软件平台的设计和路线演进;
职位要求
1. 计算机/电子/数学相关专业硕士及以上学历,5年或以上相关从业经验;
2. 具备坚实的并行计算编程基础:有CUDA/triton相关开发经验;
3. 精通各种基本算法,对操作系统、计算机体系结构有深入的认识。
4. 良好的沟通和解决问题能力、时间管理能力、自我驱动能力、英文读写能力。
5. 满足以下一种或多种条件者从优:
- 具备大模型相关量化算法开发和落地经验;
- 熟悉大模型推理及多机多卡并行优化技术,有实际开发经验;
- 熟悉常见的深度学习模型和框架;
- 对可编程并行计算芯片(如GPU/NPU/TPU)架构有深入理解,或有对应研发经历;
阿里巴巴旗下半导体公司
平头哥半导体有限公司于2018年10月31日成立,法定代表人刘湘雯,是阿里巴巴旗下半导体公司。 [1]
2023年9月18日消息,阿里平头哥、GitLink、赛昉科技等联合成立开源芯片社区。