【职位描述】:
建设高效的深度学习基础服务,为各类模型研发提供技术支撑,优化计算效率,支持算法团队业务需求落地
【主要职责】:
1. 负责深度学习平台的系统架构设计和研发工作,提供端到端的模型交付能力
2. 集成云原生能力,负责模型研发、训练、推理等相关功能,提升平台资源利用率和计算效率
3. 负责大模型训练/推理的监控、调优和故障定位
4. 持续运营,改进平台性能、易用性和稳定性,优化用户体验
职位要求
【基本资格】:
5. 计算机科学,工程或相关领域的学士学位
6. 熟悉Linux开发环境,掌握Golang/Python等语言,具备良好的代码规范意识和文档编写能力
7. 熟悉云原生相关技术,如kubernetes、kubeflow、volcano等,具备二次开发经验
8. 熟悉微服务、数据库、分布式系统、缓存技术、消息队列等相关技术
9. 强大的解决问题能力,热爱技术,有较强的自我驱动学习能力,持续关注前沿技术发展
【加分项】
1. 相关领域的硕士学位
2. 深入理解深度学习理论,熟悉主流训练推理框架Pytorch/Deepspeed/Megatron/Triton/Vllm,性能调优方向有相关项目经验
3. 参与过AI Infra相关项目,熟悉FlashAttantion、DLRover、Pytorch Elastic等社区项目
4. 具备大规模GPU集群的研发和实践经验,了解通用GPU架构、GPU虚拟化、RDMA高速网络和分布式存储技术
小鹏汽车致力于通过探索科技,引领未来出行变革,做“未来出行探索者”。公司总部位于广州,在北京、上海、深圳、肇庆、扬州等地设有研发中心,并在肇庆布局智能制造基地。同时,小鹏汽车面向全球进行研发和销售布局,已在美国设立研发中心、在欧洲多地设立分公司。小鹏汽车坚持全栈自主研发智能辅助驾驶软件和开发核心硬件,为用户带来卓越的智能驾乘体验。2020年8月27日,小鹏汽车正式登陆纽交所,募资规模打破当时全球新能源汽车行业IPO纪录,股票代码为“NYSE:XPEV”;2021年7月7日,小鹏汽车挂牌香港联交所,股票代码“9868.HK”,成为首个在中国香港和美国纽约两地双重主要上市的中国造车新势力。欲了解更多信息,请访问https://xiaopeng.com/。