职位描述
1、参与大模型超大规模任务离线训练的效率和稳定性提升的工作;
2、参与大模型在线inference吞吐/延迟优化,提升inference性价比的工作;
3、参与上述算力加速软硬件及平台体系化的设计和建设工作,支撑大模型能力建设和落地应用;
职位要求
1. 精通C/C++、Python等至少一门编程语言,以及Linux下的系统开发经验
2. 熟悉常用机器学习算法,对文本/多模态大模型相关领域模型,有极佳的工程实现能力,熟悉TF/Pytorch/Jax等深度学习框架,有相关模型训练和模型效果优化者优先
3. 熟悉大模型MegatronLM/Deepspeed/Colossal分布式训练框,深入了解模型量化、蒸馏、剪枝等模型优化原理和策略,有文本、语音、以及多模态模型相关训练、效果调优经验优先
4. 熟练使用包括vllm/sglang/tgi/tensorrtLLM/lmdeploy等一种以上模型推理服务框架,有代码分析及实践经验优先
5. 对于GPU/ASIC芯片等熟悉了解硬件系统架构,能够针对性的编写高性能的算子实现,有分析及调优能力者优先
6. 有Bert、语音TTS/ASR,以及SD等模型训练、推理优化经验者亦可
7. 在训练/推理加速相关领域的研究和成果发表者优先
同时我们还希望你
1、学习能力强,有良好的英文论文阅读能力,对新事物保有好奇心,并能快速适应新环境;
2、良好的沟通能力和团队协同能力;能与他人合作,共同完成目标;
3、对所在领域有热情,相信方法总比困难多,善于独立思考并反思总结。
2021年4月,阿里巴巴集团成立智能信息事业群,包含夸克事业部、UC事业部、书旗事业部、智能营销平台等业务版块,核心产品为夸克App、UC浏览器、书旗小说、超级汇川广告平台等。
近两年,智能信息事业群孵化的智能搜索App夸克获得快速成长,UC浏览器、书旗小说等产品持续进化,在信息服务领域取得了不同维度的突破。智能信息事业群将集中业务资源和组织优势,聚焦智能信息服务赛道的创新机会,从用户需求出发,探索AI技术的创新应用,以“智能工具+内容”的新模式,从工具产品升级到服务平台,持续为用户提供高效、智能的互联网产品。
2021年8月至今,吴嘉担任智能信息事业群总裁。