岗位职责:
1、 参与自研(多模态)模型的算法研发工作,持续提升模型能力,包括但不限于:架构设计、数据准备、模型训练、效果评测等;
2、 研究非Transformer架构下的新型训练范式,优化模型在算力受限场景的推理效率与多模态融合性能;
3、 探索模型在推理过程中的实时学习机制,实现训练与推理同步的持续进化。
任职要求:
1、 统招硕士及以上学历,2年及以上深度学习的项目经验;
2、 精通Python,熟练使用PyTorch进行模型开发,深入理解Transformer 及其衍生模型,了解非Transformer的技术路径;
3、 在计算机视觉、自然语言处理、语音合成/识别至少一个方向中具有落地经验,熟悉多模态任务的基础理论和算法,有较强的算法设计、编程实现和模型训练能力;
4、具备大规模分布式训练和模型加速优化经验,熟悉主流推理框架(如 VLLM、TGI、TensorRT-LLM);
5、 具有团队合作精神,良好的沟通能力和独立解决问题的能力。