岗位职责:
1.负责大模型相关的数据采集、清洗和预处理等工作,确保数据高可用;
2.构建产品需要的数据源,从公网、开源数据集、自己生产数据等各种角度来丰富高质量的数据;
3.负责设计和构建高效的大模型数据处理管道,形成数据处理规范;
4.与产品、算法工程师协作,通过优化数据质量支持大模型产品落地;
5.模型相关的支持类项目和工具的开发,模型服务化开发。
任职资格:
1.统招本科及以上,计算机类相关专业,扎实的编程能力,精通Python语言,快速进行数据处理;
2.能根据研发、产品的需求,自主完成数据处理工作,提供合适的数据给下游任务;
3.至少两年以上的AI数据处理经验.包括不限于数据定义、清洗、拆分、存储等数据处理流程,对爬虫有一定的认知;
4.熟悉server端开发者优先。