智能信息-大模型算力加速工程师

职位描述

1、参与大模型超大规模任务离线训练的效率和稳定性提升的工作;

2、参与大模型在线inference吞吐/延迟优化,提升inference性价比的工作;

3、参与上述算力加速软硬件及平台体系化的设计和建设工作,支撑大模型能力建设和落地应用;

职位要求

1. 精通C/C++、Python等至少一门编程语言,以及Linux下的系统开发经验

2. 熟悉常用机器学习算法,对文本/多模态大模型相关领域模型,有极佳的工程实现能力,熟悉TF/Pytorch/Jax等深度学习框架,有相关模型训练和模型效果优化者优先

3. 熟悉大模型MegatronLM/Deepspeed/Colossal分布式训练框,深入了解模型量化、蒸馏、剪枝等模型优化原理和策略,有文本、语音、以及多模态模型相关训练、效果调优经验优先

4. 熟练使用包括vllm/sglang/tgi/tensorrtLLM/lmdeploy等一种以上模型推理服务框架,有代码分析及实践经验优先

5. 对于GPU/ASIC芯片等熟悉了解硬件系统架构,能够针对性的编写高性能的算子实现,有分析及调优能力者优先

6. 有Bert、语音TTS/ASR,以及SD等模型训练、推理优化经验者亦可

7. 在训练/推理加速相关领域的研究和成果发表者优先

同时我们还希望你

1、学习能力强,有良好的英文论文阅读能力,对新事物保有好奇心,并能快速适应新环境;

2、良好的沟通能力和团队协同能力;能与他人合作,共同完成目标;

3、对所在领域有热情,相信方法总比困难多,善于独立思考并反思总结。

公司地点:广州海珠区阿里中心·广州琶洲阿里中心

公司简介:

2021年4月,阿里巴巴集团成立智能信息事业群,包含夸克事业部、UC事业部、书旗事业部、智能营销平台等业务版块,核心产品为夸克App、UC浏览器、书旗小说、超级汇川广告平台等。

近两年,智能信息事业群孵化的智能搜索App夸克获得快速成长,UC浏览器、书旗小说等产品持续进化,在信息服务领域取得了不同维度的突破。智能信息事业群将集中业务资源和组织优势,聚焦智能信息服务赛道的创新机会,从用户需求出发,探索AI技术的创新应用,以“智能工具+内容”的新模式,从工具产品升级到服务平台,持续为用户提供高效、智能的互联网产品。

2021年8月至今,吴嘉担任智能信息事业群总裁。

职位发布者:何经理

优视科技(中国)有限公司

融资阶段:

公司规模:100~499人

相似职位: