推理引擎优化专家

我们隶属于蚂蚁集团-平台工程与技术风险部-智能容量团队,致力于建设全球一流的数据驱动智能容量技术,实现蚂蚁集团容量无人值守全自动化管理

团队介绍

1、研发面向云计算底座海量数据的大模型,包括但不限于代码大模型、全模态、大规模图学习等领域相关的大模型的应用算法研发;

2、参与大模型应用研发全流程的工作,包括但不限于模型算法设计、代码开发、训练、部署优化、调试、评测;技术创新如专利、论文的撰写;外部技术影响力交流等;

3、推动大模型在DevOps提效、内外部智能体业务应用、爆款AI原生应用、安全和技术风险防控等场景的业务落地;

职位描述

1. 负责大模型推理性能的分析与优化,针对蚂蚁核心业务场景,实施推理引擎的性能优化,提升推理效率。

2. 熟悉主流推理框架(如trt、sgLang等)的使用,具备一定的框架优化能力,能够针对业务需求进行定制化优化

3. 参与推理引擎核心模块的开发,能够快速学习新特性并推动技术落地。

4. 参与PD分离架构的设计与优化,实现两者的解耦与协同执行,提升系统整体性能和推理效率。

5. 在KV cache、量化、投机采样等领域有实际优化经验者优先,可以针对业务场景提出并实施性能优化方案。

6. 熟练掌握Python、C++等编程语言,对系统软件有浓厚兴趣,具备较强的学习能力和团队合作精神,能够独立完成技术难题攻关。

公司地点:北京海淀区丽金智地中心1

公司简介:

职位发布者:曾女士

支付宝(杭州)数字服务技术有限公司

融资阶段:

公司规模:

相似职位: