AI基础架构工程师(大模型工程化方向)工作地点: [填写您公司所在的城市,如:广州/深圳/北京]关于我们与这个机会:我们是钛动科技营销智能中心的核心算法团队,正处于用AI重塑全球营销产业的前沿阵地。我们的使命不仅是研发出最先进的算法模型,更是要构建一套能够承载这些“智慧大脑”的强大基础设施。您将要加入的,是为我们两大战略级AI项目——“钛动出海营销智能体 (Navos)” 和 “钛极大模型” 提供核心动力与保障的AI基础架构团队。您面对的不是常规的业务系统,而是如何驯服和驾驭AIGC、大模型这些“性能猛兽”的终极技术挑战。您将有机会:- 与华为云等顶级伙伴紧密合作,参与业界领先的AI Infra建设。- 亲手设计和打造支撑亿级请求的、高并发、低延迟的大模型推理服务。- 决定我们AI能力的上限——您构建的系统将直接影响“钛极模型”的响应速度、运行成本和稳定性。如果您是一位对极致性能有追求、对系统稳定性有执念、渴望在AI时代浪潮中构建坚实“底座”的技术专家,这里将是您实现技术抱负的理想之地。岗位职责:1. 模型工程化与服务化: 负责“钛极大模型”的服务化封装、部署与生命周期管理,构建稳定、可靠、可观测的模型API服务。1. 推理性能极致优化: 深入研究大模型的推理性能瓶颈,应用模型量化、蒸馏、剪枝、算子融合等技术,并结合TensorRT、ONNX Runtime等加速框架,实现推理延迟和成本的极致优化。1. AI Infra平台建设: 参与或主导AI基础架构平台/工具链的设计与建设,包括但不限于CI/CD for Models(模型的持续集成与部署)、模型版本管理、在线实验(A/B测试)平台等,提升算法团队的迭代效率。1. GPU资源管理与调度: 负责公司GPU集群的资源调度、监控与运维,基于Kubernetes等云原生技术,提升GPU资源的利用率和分配效率。1. 技术协同与赋能:- 与算法工程师紧密合作,理解模型结构与计算特点,并将其转化为高效、可扩展的工程实现。- 为业务开发团队提供稳定、易用的模型服务接口与技术支持,确保AI能力顺畅地赋能上层应用。任职要求:必备条件:6. 编程功底: 精通Python/Go/C++中至少一门编程语言,具备扎实的软件工程基础和优秀的系统设计能力。6. 云原生技术: 熟悉Docker、Kubernetes (K8s) 等云原生技术栈,有容器化应用的部署和运维经验,熟悉至少一种主流公有云(华为云/AWS/阿里云等)。6. MLOps实践经验: 具备实际的机器学习模型(尤其是深度学习大模型)部署、运维和优化的项目经验,理解MLOps的核心理念与流程。6. 深度学习框架: 熟悉PyTorch/TensorFlow/JAX等至少一种主流深度学习框架的底层原理,了解其训练和推理过程。6. 问题解决能力: 具备优秀的系统性问题分析与解决能力,能够快速定位并解决复杂的线上性能和稳定性问题。加分项:- 有TensorRT、ONNX Runtime、Triton Inference Server、vLLM等模型推理加速或服务框架的深度使用和优化经验者优先。- 有分布式系统、高性能计算(HPC)或GPU编程(CUDA)经验者优先。- 有Kubeflow、MLflow等MLOps平台的建设或二次开发经验者优先。- 对AI芯片(如NVIDIA GPU架构)有一定了解者优先。- 有相关领域的开源项目贡献者优先。我们正在寻找AI时代的“引擎工程师”,期待您的加入,与我们共同为顶尖的智慧大脑,构建一颗强大的“中国芯”!