多模态大模型算法工程师（基座训练方向）

岗位职责：

1、参与自研（多模态）模型的算法研发工作，持续提升模型能力，包括但不限于：架构设计、数据准备、模型训练、效果评测等；

2、研究非Transformer架构下的新型训练范式，优化模型在算力受限场景的推理效率与多模态融合性能；

3、探索模型在推理过程中的实时学习机制，实现训练与推理同步的持续进化。

任职要求：

1、统招硕士及以上学历，2年及以上深度学习的项目经验；

2、精通Python，熟练使用PyTorch进行模型开发，深入理解Transformer 及其衍生模型，了解非Transformer的技术路径；

3、在计算机视觉、自然语言处理、语音合成/识别至少一个方向中具有落地经验，熟悉多模态任务的基础理论和算法，有较强的算法设计、编程实现和模型训练能力；

4、具备大规模分布式训练和模型加速优化经验，熟悉主流推理框架（如 VLLM、TGI、TensorRT-LLM）；

5、具有团队合作精神，良好的沟通能力和独立解决问题的能力。

公司地点：上海浦东新区模力社区T1