职位描述
我们正在寻找一名机器学习工程师(Machine Learning Engineer, MLE)加入我们的团队,负责设计、开发和部署高性能的机器学习模型,以解决实际业务问题。您将与数据科学家、软件工程师和产品团队紧密合作,将AI/ML模型从实验阶段推进到生产环境,并优化其性能和可扩展性。
核心职责
机器学习模型开发与优化
研究、开发和优化机器学习/深度学习模型(如分类、回归、推荐系统、NLP、CV等)。
进行特征工程、模型训练、调参和评估,确保模型的高准确性和泛化能力。
探索和实验最新的AI/ML技术(如LLM、Diffusion Models、强化学习等)。
模型部署与生产化(MLOps)
将机器学习模型部署到生产环境(如云服务、边缘设备、嵌入式系统等)。
构建自动化训练和推理流水线(使用TensorFlow Serving、ONNX、TorchScript等)。
优化模型推理性能(如量化、剪枝、蒸馏、GPU/TPU加速)。
数据处理与基础设施搭建
构建高效的数据处理流水线(ETL、特征存储、数据版本控制)。
管理大规模数据集,确保数据质量、隐私和合规性(如GDPR)。
搭建和维护MLOps基础设施(如MLflow、Kubeflow、Airflow、Docker/Kubernetes)。
跨团队协作与产品落地
与数据科学家、软件工程师和产品经理合作,理解业务需求并制定技术方案。
监控模型在生产环境的表现,持续优化并解决潜在问题(如数据漂移、模型退化)。
任职要求(能力要求)
必备技能
- 编程能力:
精通Python,熟悉PyTorch/TensorFlow/Keras等主流ML框架。
熟悉软件工程最佳实践(版本控制、单元测试、CI/CD)。
- 机器学习基础:
扎实的机器学习理论基础(监督/无监督学习、深度学习、统计建模)。
熟悉常见算法(如XGBoost、CNN/RNN/Transformer、聚类算法)。
- MLOps & 部署经验:
有模型部署经验(如Flask/FastAPI、Docker、Kubernetes)。
熟悉云平台(AWS SageMaker/GCP Vertex AI/Azure ML)。
- 数据处理能力:
熟练使用SQL、Pandas、Spark等处理大规模数据。
了解数据流水线工具(如Apache Beam、Airflow)。
加分项(Nice to Have)
- 熟悉LLM(如GPT、Llama、RAG)、LangChain、向量数据库。
- 有推荐系统、计算机视觉(CV)或自然语言处理(NLP)项目经验。
- 熟悉边缘AI部署(如TensorRT、ONNX Runtime)。
- 有开源项目贡献或Kaggle/竞赛获奖经历。
教育背景
计算机科学、人工智能、数据科学、数学或相关领域的本科/硕士学历。
或具备同等行业经验(3年+ MLE/数据科学家经验)。