大模型算法实习生(预训练数据方向)

岗位职责:

1. 预训练相关数据获取和处理:深度参与团队预训练基座大模型的研发,负责数据构建,包括不限于数据分类、数据质量计算、数据合成、分布式数据处理pipeline构建。

2.数据scaling-law验证:在小尺寸模型上进行模型训练,探索数据质量、合成数据、数据配比等对模型的影响,提升数据质量和多样性,并验证数据价值和效果。

任职要求

1. 计算机相关专业本科及以上学历,熟练掌握自然语言处理、深度学习的基础理论和方法。

2. 具有扎实的的编程能力,熟练掌握至少一门编程语言(C/C++/Python/Java),熟悉TensorFlow/Pytorch等深度学习框架。

3. 熟悉Transformer/GPT系列/LLaMA/GLM/Qwen/DeepSeek等预训练模型,对模型训练和应用有一定理解。

4. 了解DeepSpeed、Megatron等分布式训练框架,有一定多机多卡分布式训练与debug经验。

5. 较强的技术攻关能力,能够跟进领域内最新的技术研究成果,结合实际应用场景快速实验和落地。

6.有大模型训练或数据相关经验优先。

本岗位为日常实习生需要近期可入职,已在其它途径投递过简历请勿重复投递,谢谢配合

公司地点:北京海淀区互联网金融中心23层

公司简介:

小鹏汽车致力于通过探索科技,引领未来出行变革,做“未来出行探索者”。公司总部位于广州,在北京、上海、深圳、肇庆、扬州等地设有研发中心,并在肇庆布局智能制造基地。同时,小鹏汽车面向全球进行研发和销售布局,已在美国设立研发中心、在欧洲多地设立分公司。小鹏汽车坚持全栈自主研发智能辅助驾驶软件和开发核心硬件,为用户带来卓越的智能驾乘体验。2020年8月27日,小鹏汽车正式登陆纽交所,募资规模打破当时全球新能源汽车行业IPO纪录,股票代码为“NYSE:XPEV”;2021年7月7日,小鹏汽车挂牌香港联交所,股票代码“9868.HK”,成为首个在中国香港和美国纽约两地双重主要上市的中国造车新势力。欲了解更多信息,请访问https://xiaopeng.com/。

职位发布者:熊经理

广州小鹏汽车科技有限公司

融资阶段:

公司规模:1000~9999人

相似职位: