跨境搜索推荐-机器学习架构工程师

岗位职责

1、优化深度学习在线推理服务框架,包括架构设计、系统研发、性能优化,保障模型推理性能与部署效率;​

2、优化深度学习模型训练框架,包括不限于CPU/GPU的稀疏训练框架、大模型训练加速以及离线模型推理优化,保障模型训练的稳定与高效;​

3、优化机器学习计算平台,负责构建一站式机器学习解决方案,涵盖从数据集管理、模型训练、模型优化、模型上线以及分布式计算全流程。

任职要求

1、本科及以上学历,具有扎实的计算机基础, 熟悉操作系统和网络, 精通C/C++和Python编程语言, 对数据结构&算法设计有较深刻的理解;​

2、精通至少一种主流的深度学习框架,如Tensorflow或Pytorch;​

3、精通至少一种主流的模型推理框架,如TensorRT或onnxruntime;​

4、责任心强,思路清晰,技术视野开阔,对业界新技术敏感,喜欢钻研,具有良好的学习能力并注重团队合作。​

加分项

1、有大模型如llama、gpt,训练推理以及调优经验者优先;​

2、熟悉CUDA编程,有算子开发经验者优先;​

3、熟悉分布式训练框架者优先,包括不限于Parameter Server架构,训练框架Horovod、 DeepSpeed或者Megatron-LM;​

4、了解底层通信库者优先,比如MPI、NCCL或brpc;​

5、了解Kubernetes,有相关开发经验者优先;​

6、有大型互联网系统(广告、搜索、推荐)经验者优先。

公司地点:上海金虹桥国际中心座办公楼南楼

公司简介:

职位发布者:孙国琛

上海从鲸信息技术有限公司

融资阶段:

公司规模:500~999人

相似职位: