岗位职责:1. 协助AI应用模型的开发。
2. 针对业务场景需求,开发并优化传统机器学习模型(如分类、回归、聚类等)及深度学习模型。
3. 完成大模型(LLM)的微调(Fine-tuning)、蒸馏(Knowledge Distillation)、压缩及性能优化,提升模型在垂直场景的适用性。
4. 利用MLflow实现模型训练、实验跟踪、版本管理及部署的全流程管理。
5. 参与数据预处理、特征工程、模型评估及线上服务性能调优,确保系统高效稳定运行。
6. 跟踪前沿技术(如大模型训练优化、轻量化部署),推动技术创新与业务落地结合。
7. 撰写技术文档,与产品、工程团队协作,推动算法模型的产品化落地。
任职要求:
技术能力
机器学习基础:精通经典算法(线性回归、决策树、SVM、集成学习等)及深度学习模型(CNN/RNN/Transformer)。
大模型技术:
熟悉大模型(如Deepseek、GPT系列)的微调技术(LoRA、Adapter等)及蒸馏方法(模型压缩、知识迁移)。
了解大模型训练优化技术(分布式训练、混合精度训练、显存优化)。
编程能力:
熟练使用Python及主流框架(PyTorch/TensorFlow/Keras)。
熟悉大模型生态工具(Hugging Face、LangChain)、部署工具(vLLM、FastAPI)。
工具链:
熟悉MLflow进行模型生命周期管理,或有类似工具(Kubeflow、TFX)使用经验。
了解低代码平台Dify的应用开发流程,或有快速构建AI应用的经验。
熟悉Git、Docker、Kubernetes等开发与部署工具。
数据处理:具备数据清洗、特征工程、可视化及大规模数据集的建模经验。
有模型服务化(ONNX/TensorRT)、边缘端部署或高并发场景优化经验。
熟悉大模型Agent技术、RAG(检索增强生成)或垂直领域微调经验(如金融、医疗)。