AI Infra工程师

岗位职责：负责LLM模型算法的工程化落地，包括但不限于：

1.参与大语言模型的算法落地与训练/推理平台建设，支撑模型在多场景中的高效部署与运行；

2.熟悉大模型相关技术栈和工程框架，负责模型在多 GPU、分布式环境下的部署与性能调优；

3.参与构建和优化模型服务接口，提升服务的稳定性与响应效率，保障高可用、低延迟的在线推理体验。

任职要求：

1.硕士及以上学历，计算机、人工智能、软件工程等相关专业。具备大模型算法研发经验，熟悉模型训练、微调、推理等完整流程；

2.理解 Transformer 基本原理，熟悉大语言模型架构，能够结合其计算特性进行系统侧的协同优化，有大模型训练或推理优化经验者优先；

3.具备系统性能优化和分布式集群调优经验，了解推理加速、GPU 调优、容器化部署等相关技术，有国产化算力适配经验者优先；

4.熟练使用 PyTorch，了解 vLLM、SGLang 等主流推理框架，具备实战经验者优先；

5.精通Docker/Kubernetes、CI/CD、日志监控与自动化测试。

公司地点：北京海淀区银谷大厦7