【职位描述】
负责⼤语⾔模型的训练与评估数据集构建、模型的训练与微调技术体系的搭建,以及⾯向业务场景的
落地
【任职要求】
1、计算机相关专业本科以上学历,精通⾄少⼀⻔语⾔,Java/C++/Python等,具有扎实的代码功底
2、深⼊理解transformer架构体系,具有本科毕业+ 5年及以上或博⼠毕业3年以上算法实践及优化经
验
3、具有实际的LLM语料库构建或模型训练与调优经历,熟悉常⻅的⽂本分类/去重做法,了解long
context、peft、moe等技术
4、理解和熟练使⽤pytorch、deepspeed、megatron等训练框架
【加分项:满⾜⼀项即可,多项更佳】
1、在国内外⼀线互联⽹公司有通过算法提升核⼼业务指标的经验
2、在国内外顶级 AI 会议上发表过论⽂
3、在⼀线公司担任团队或技术负责⼈