数据挖掘

岗位职责

1.负责大模型预训练数据和对齐数据收集和处理链路

2.理解数据需求,与业务紧密配合,建立自动化数据处理流程及工具

3.建立数据分类体系和质量评估体系

4.提升大模型对齐数据的构建效率

5.持续关注社区进展,跟进最新数据集、数据处理相关论文

任职要求

1.本科及以上学历,计算机相关专业优先

2.良好的编程习惯,熟悉Python编程语言

3.熟悉常见的NLP算法

4.有大数据相关经验优先,有大模型文本数据处理经验优先

5.在数据处理方向有开源项目贡献经历、有相关论文经验优先

深言科技(DeepLangAI)是当前最热门的大模型赛道明星创业公司,孵化自清华大学与智源人工智能研究院,由欧洲科学院院士领衔担任首席科学家。创始团队均为清华博士硕士,并有多名字节等大厂高管加盟。公司成立至今已获得红杉、腾讯、好未来、奇绩创坛等顶级机构数亿元投资。

旨在打造基于大模型的新一代智能信息处理平台,为数亿脑力劳动者和数千万信息密集型组织重塑信息处理全流程。目前产品全网用户总数超800w,用户月活超50w。

【公司亮点】

1️⃣公司背景豪华:孵化自清华大学计算机系自然语言处理实验室(THUNLP)和北京智源人工智能研究院(BAAI),由欧洲科学院院士领衔担任首席科学家;

2️⃣技术实力超群:团队已发表顶级论文数百篇,核心成员来自大模型“国家队”——智源悟道大模型研发团队,深度参与了中国第一个大模型的研发;最新自研大模型DLM在多项评测中表现优异;

3️⃣业务开展迅速:正式已有数百万用户的产品,其中部分产品受到央视等媒体报道;同时已和政府、央企、媒体、高校等不同行业的标杆客户达成商业合作;

4️⃣顶级风投青睐:已获得红杉中国、腾讯、好未来、奇绩创坛、北京智源人工智能研究院等顶级机构的数亿元财务及战略投资,还有多名成功创业者个人投资并出任顾问;

5️⃣团队综合多元:团队中既有来自清华等高校的优秀年轻人肆意挥洒才能(包括全国AI比赛冠军、省高考状元等),又有字节等互联网大厂高管及资深人士保驾护航;

【为你提供】

1️⃣完善的福利待遇:竞争力的薪酬、五险一金、年终奖、带薪年假、交通补助、餐补、定期体检、生日/节假日福利、不限量零食饮料等;

2️⃣舒适的工作环境:公司位于清华东南门口,毗邻五道口地铁站,交通便利;办公环境舒适,设施齐全(人体工学椅、高清显示器、高配Mac/PC等),我们愿意提供一切能提高工作效率和工作体验的设施;

3️⃣简单开放的文化:提倡简单、坦诚、高效、开放的公司文化,实行一定程度的弹性工作制,我们希望每个人都能高效工作、快乐生活,拒绝无效内卷;

4️⃣公司发展的红利:我们相信优秀的人才是成就所有伟大事业最重要的因素,因此公司预留了充足的期权池,我们十分愿意通过股权激励的方式与更多人分享公司发展的红利;

5️⃣成就梦想的机会:我们是一群充满激情、心怀梦想的年轻人,深知很多人并非没有能力,而是缺少锻炼自我的熔炉与展现自我的舞台,而我们希望为志同道合的你提供成就梦想的机会,无论是技术、产品还是设计,我们都将为你匹配最顶级的资源、创造最好的条件,实现共同的梦想!

公司地点:北京海淀区东升大厦A座501

公司简介:

职位发布者:邓先生

北京深言科技有限责任公司

融资阶段:

公司规模:

相似职位: