岗位职责:
1. 负责设计、开发与优化 AI 模型训练流程,聚焦于自然语言处理、图像识别等领域的应用;
2. 执行数据收集、清洗、标注及预处理等日常工作,追踪 AI 技术前沿,及时融入新方法以提升模型性能;
3. 开展 DeepSeek 等模型的核心技术研究与开发,针对模型训练问题(如过拟合、收敛慢)制定应对策略;
4. 完成模型训练、评估、优化及部署,保障模型在实际场景中的准确性与效率;
5. 参与团队代码评审,持续提升团队整体开发效率与模型质量。
任职要求:
1. 本科及以上学历,计算机、人工智能、数据科学相关专业,具备优秀的技术沟通与文档撰写能力;
2. 熟练掌握 Python 编程语言,熟悉深度学习框架(如 TensorFlow、PyTorch),具备良好的编程习惯;
3. 精通数据处理流程,熟练使用 Pandas、Numpy 等数据处理工具及主流标注工具;
4. 拥有模型训练优化经验,熟悉混合精度训练等优化策略,了解 ONNX Runtime 等模型部署技术;
5. 深入理解 AI 模型原理与逆向分析,至少精通一种模型架构(如 Transformer);
6. 具备实际项目经验,能独立分析解决模型训练中的问题(如准确率低、资源消耗高等)。