高级/资深开发工程师(推理) (MJ018923)

注意:常规业务开发同学请勿投递。该岗位围绕大模型框架进行研发,以推理框架开发为主,非业务开发岗位。

职位描述

1. 负责大语言模型训练、推理引擎的架构设计与开发,支撑千亿参数模型的高效分布式推理。

2. 研发面向GPU/NPU等异构计算平台的高性能算子,提升硬件利用效率。

3. 攻克分布式推理中的动态负载均衡、通信优化、显存管理等核心技术难题。

4. 跟踪学术界与工业界前沿技术,推进框架迭代。

任职要求

1. 计算机、数学、电子工程、通信等相关专业本科及以上学历.

2. 熟练掌握C++/Python, 熟悉 PyTorch/TensorFlow/PaddlePaddle 等深度学习框架之一,具备大型项目代码架构设计能力.

3. 熟悉Transformer架构及大模型推理相关技术(如FlashAttention、PagedAttention、Continuous Batching).

4. 有实际大模型部署及调优经验,熟悉量化(INT8/FP8)等优化手段.

5. 有GPU/NPU 算子优化经验,有并行计算相关背景者优先.

公司地点:深圳南山区南山区科技园1

公司简介:

唯品会(NYSE:VIPS)VIP.com成立于2008年,以“品牌特卖”为宗旨,在中国开创了“精选品牌、深度折扣、限时抢购”的时尚特卖模式,在线销售服饰鞋包、美妆、母婴、居家、生活等全品类名品。2012年3月23日,唯品会在美国纽约证券交易所(NYSE)上市。

唯品会作为全球领先的特卖电商,获评2022福布斯中国年度最佳雇主和最具可持续发展力雇主,多次入选“《财富》中国500强”、“中国民营企业500强”榜单,并在2023年荣获“全国五一劳动奖状”。

职位发布者:龙女士

唯品会(中国)有限公司

融资阶段:

公司规模:1000~9999人

相似职位: