深度学习框架研发工程师

岗位职责:

负责预训练模型的训练加速。包括但不限于优化Megatron,DeepSpeed,PyTorch等框架,数据读取,网络通信,计算算子等优化方向;

负责预训练模型的部署加速。包括但不限于多卡任务调度,算子优化等;

任职资格:

本科以上学历,计算机相关专业,三年以上深度学习模型开发经验;

熟练使用CUDA/C++/Python等相关工具,有一到两个熟悉的深度学习框架;

对预训练模型技术有一定的理解,能够与算法团队顺畅沟通技术概念;

对于模型训练、预测、服务化的加速有一定经验;

对AI预训练模型技术方向有热情。

公司地点:北京海淀区北京大学中关新园1栋

公司简介:

腾讯以技术丰富互联网用户的生活。

通过通信及社交平台微信和 QQ 促进用户联系,并助其连接数字内容和生活服务,尽在弹指间。

通过高效广告平台,协助品牌和市场营销者触达数以亿计的中国消费者。

通过金融科技及企业服务,促进合作伙伴业务发展,助力实现数字化升级。

我们大力投资于人才队伍和推动科技创新,积极参与互联网行业协同发展。

腾讯于 1998 年11月在中国深圳成立,2004 年6月在香港联合交易所主板上市。

职位发布者:周女士

腾讯科技(上海)有限公司

融资阶段:

公司规模:1000~9999人

相似职位: