岗位职责: 负责LLM模型算法的工程化落地,包括但不限于:
1.参与大语言模型的算法落地与训练/推理平台建设,支撑模型在多场景中的高效部署与运行;
2.熟悉大模型相关技术栈和工程框架,负责模型在多 GPU、分布式环境下的部署与性能调优;
3.参与构建和优化模型服务接口,提升服务的稳定性与响应效率,保障高可用、低延迟的在线推理体验。
任职要求:
1.硕士及以上学历,计算机、人工智能、软件工程等相关专业。具备大模型算法研发经验,熟悉模型训练、微调、推理等完整流程;
2.理解 Transformer 基本原理,熟悉大语言模型架构,能够结合其计算特性进行系统侧的协同优化,有大模型训练或推理优化经验者优先;
3.具备系统性能优化和分布式集群调优经验,了解推理加速、GPU 调优、容器化部署等相关技术,有国产化算力适配经验者优先;
4.熟练使用 PyTorch,了解 vLLM、SGLang 等主流推理框架,具备实战经验者优先;
5.精通Docker/Kubernetes、CI/CD、日志监控与自动化测试。