LLM算法专家

【职位描述】

负责⼤语⾔模型的训练与评估数据集构建、模型的训练与微调技术体系的搭建,以及⾯向业务场景的

落地

【任职要求】

1、计算机相关专业本科以上学历,精通⾄少⼀⻔语⾔,Java/C++/Python等,具有扎实的代码功底

2、深⼊理解transformer架构体系,具有本科毕业+ 5年及以上或博⼠毕业3年以上算法实践及优化经

3、具有实际的LLM语料库构建或模型训练与调优经历,熟悉常⻅的⽂本分类/去重做法,了解long

context、peft、moe等技术

4、理解和熟练使⽤pytorch、deepspeed、megatron等训练框架

【加分项:满⾜⼀项即可,多项更佳】

1、在国内外⼀线互联⽹公司有通过算法提升核⼼业务指标的经验

2、在国内外顶级 AI 会议上发表过论⽂

3、在⼀线公司担任团队或技术负责⼈

公司地点:北京中关村软件园

公司简介:

职位发布者:卞俊豪

上海聿贵企业管理咨询有限公司

融资阶段:不需要融资

公司规模:

相似职位: