大模型机器学习平台专家

岗位职责:

1、负责机器学习推理训练框架的研究与开发,服务于全公司各个产品;

2、参与机器学习训练框架底层组件的抽象,设计,优化与落地;

3、与全公司算法部门深度合作,为重点项目进行算法与系统的联合优化。

职位要求

1、熟练掌握Linux环境下的C/C++与Python语言;

2、接触过至少一种机器学习框架(PyTorch / Tensorflow / Jax 或其他自研框架);

3、有以下至少一项的背景知识与经验:CUDA编程、编译器、高性能网络、分布式存储、超大规模分布式;

4、具有独立解决问题的能力,良好的团队合作精神;

5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力;

6、有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档。

加分项:

1、深入研究过至少一种机器学习框架(Tensorflow / PyTorch /Jax 或其他自研框架)的底层架构和机制;

2、熟悉至少一种经典深度学习模型及其应用场景,如ResNet、transformer、wave2vec、CLIP多模态,或者了解强化学习、diffusion model等;

3、有研究生或博士阶段的计算机系统方向(包含分布式系统、并行算法、编程语言与编译器、RDMA网络、存储、高性能计算等)研究背景;

4、有软硬件联合设计,底层性能优化(cutlass,NCCL等)的经验; 5、能使用数学工具分析深度学习训练中的优化收敛、量化压缩等算法;

6、贡献过开源社区代码。

公司地点:北京量子芯座

公司简介:

职位发布者:卞俊豪

上海聿贵企业管理咨询有限公司

融资阶段:不需要融资

公司规模:

相似职位: