岗位职责:
1. 负责北医三院医疗大模型在燧原GCU集群上的高效部署与推理加速。
2. 完成PyTorch/TF框架的定制化移植,优化模型计算图,实现混合精度训练。
3. 进行模型压缩与性能调优,提升模型吞吐量30%以上,同时保持大于95%的准确率。
4. 开发容器化部署脚本,构建万卡推理集群。
任职要求:
1. 精通燧原GCU架构及TopsRider软件栈,有PaddlePaddle/飞桨CustomS
Device开发经验者优先。
2. 熟练掌握模型量化技术,有燧原S60/L60卡优化经验者优先。
3. 具备分布式训练经验,熟悉Horovod或DeepSpeed框架,能设计支持128卡以上的同步/异步训练方案。
4. 计算机、人工智能等相关专业硕士及以上学历。
5. 工作地点深圳、北京。