负责分析和优化大模型的分布式训练全链路过程,以提升训练性能和效率
职位要求
1、本科及以上学位,计算机、深度学习等相关专业,3年及以上工作经验
2、熟练掌握Linux环境下的C/C++与Python语言
3、熟练使用至少一种训练框架(Tensorflow、PyTorch或其他自研框架)
4、熟练使用至少一种大规模训练优化框架(Megatron、DeepSpeed、Lightseq或其他自研框架)
加分项
百亿以上GPT或MoE等大型预训练模型实践经验
深入研究过至少一种框架(Tensorflow、PyTorch、Megatron、DeepSpeed、Lightseq或其他自研框架)的底层架构和机制
能使用数学工具分析深度学习训练中的优化算法
Momenta是全球领先的自动驾驶公司,致力于通过突破性的AI科技,创造更美好的生活。为实现可规模化的自动驾驶,Momenta基于数据驱动的“飞轮”技术洞察,以及量产自动驾驶(Mpilot)与完全无人驾驶(MSD)相结合的“两条腿”产品战略,提供不同级别的自动驾驶解决方案,更高效快速地实现无人驾驶规模化落地,赋能更安全、便捷、高效的未来智慧出行。
目前,Momenta已与全球排名前十的汽车集团达成深度合作,包括上汽集团、比亚迪、通用汽车、丰田、奔驰在内的多家国际、国内顶级车企和一级供应商,联手打造高阶智能驾驶解决方案。
Momenta 是全球领先的自动驾驶公司,致力于通过突破性的AI科技,创造更美好的生活。为实现可规模化的自动驾驶,Momenta基于数据驱动的“飞轮”技术洞察,以及量产自动驾驶(Mpilot)与完全无人驾驶(MSD)相结合的“两条腿”产品战略,提供不同级别的自动驾驶解决方案,更高效快速地实现无人驾驶规模化落地,赋能更安全、便捷、高效的未来智慧出行。
Momenta成立于2016年,在中国、德国、日本有全球业务,并已获得上汽集团、通用汽车、梅赛德斯-奔驰、丰田和博世的战略投资。