职位描述
1、负责多模态大模型预训练和对齐相关的工作,包括但不限于:多模态预训练、视觉预训练、文本预训练、多模态对齐等;
2、负责百亿规模多模态数据处理和清洗工作,包括图文数据、网页数据、短视频等多模态数据相关性、数据质量建设等等;
3、负责将多模态大模型落地到推荐、搜索、电商、商业化等应用场景,从预训练层面提升各个场景的内容理解能力;
4、负责跟进多模态大模型的前沿研究,保持部门在大模型方面的技术领先。
任职要求
1、硕士及以上学历,有大规模模型训练、压缩、蒸馏、微调等经验,熟悉megatron、deepspeed等框架者优先;
2、有较强的学术调研、文献阅读和算法实现能力,优秀的独立开发、调试能力,有高质量论文、开源项目、ACM竞赛经历、相关学术
3、会议组织的权威比赛获奖经历或落地项目产出者优先;
4、精通至少一种技术语言,包括但不限于Java、C/C++、C#、Python等。