数据采集工程师

【注:岗位base在苏州总部】

【注:岗位base在苏州总部】

【注:岗位base在苏州总部】

高亮:岗位后期必定会验证【学历】、【薪资】、【履历】,希望同学们诚信求职。

工作职责:

1、独立完成各类网站数据采集任务,保障数据的准确性与时效性

2、持续优化网页信息抽取规则,提高网页抓取效率、质量等问题

3、监控采集系统运行,维护日常采集任务状态。

硬性技能:

1、 熟悉基于XPath、CSS等网页信息抽取技术

2、熟悉关系型和非关系型数据库

3、熟练使用python,了解scrapy框架

4、熟悉网页抓取原理及技术,了解基本网络协议

核心素质:

1、自主驱动型成长:保持技术敏感度,主动追踪爬虫领域新技术新方法

2、问题终结者:对数据偏差零容忍,具备从现象定位到根因分析的解决能力

3、交付可靠性:具备任务优先级管理能力,承诺时效内确保高质量交付

4、技术钻研精神:乐于研究网站架构特点,持续优化采集策略

加分项(非必需):

• 了解分布式爬虫架构(Scrapy-Redis/Scrapy-Cluster)

• 有JS逆向/安卓逆向相关经验

我们提供:

» 完备的爬虫技术体系培训(动态渲染破解/验证码绕过/IP代理策略等)

» 参与千万级数据采集项目的实战机会

» 技术大牛成长指导,快速构建爬虫工程师核心能力

公司地点:上海浦东新区上海浦东新区世纪汇广场

公司简介:

企查查创立于2014年3月,总部位于苏州,是一家拥有海量企业信息、全面维度数据、庞大终端用户的创新公司,成立初始便被评定为国家高新技术企业。公司专注于大数据挖掘,数据建模,行业标准定义和可视化分析技术等领域。依赖超强研发实力,打造了国内首款企业信用信息查询应用——企查查APP。

企查查平台基于完全公开的全国工商信息、诉讼信息、知识产权信息等,对数据进行结构化整理,为用户提供免费的一站式查询服务。同时,通过对数据的深度分析,挖掘企业、高管之间的关联关系,帮助普通用户快速掌握企业征信能力,详实了解合作公司,预防潜在风险。并且,企查查也为B端用户提供SaaS平台、数据定制等专属服务,为企业经营、风险监控等提供数据支撑。

企查查涵盖全球超5.5亿家企业数据,汇集了目前国内市场中的80个产业链,8000个行业,6000个市场,工商数据 3亿+,司法案件 1.8亿+,新闻舆情 3.8千万,知识产权 1.7亿,招投标1.1亿+。目前用户量超5亿,累积查询量超10万亿次。企查查品牌更是被认定为名牌商标,深受社会各界的认可和赞许,连续多年入选中国互联网综合实力百强企业,并成为商查行业首个中国独角兽企业。

随着市场加速扩张,企查查也走得愈发稳健,中国信通院《企业信用大数据行业发展研究报告》显示,企业信用数据行业市场规模已达千亿元,企查查在“用户规模、数据体量、用户粘性”等方面居于行业第一。并且,在信息安全、合规方面,企查查获得了公安部计算机信息安全等级保护3级认证、央行征信备案机构等资质认证。

2023年5月,企查查发布全球首款商查大模型——知彼阿尔法,同月获“中国智能科学技术最高奖”吴文俊人工智能科学技术奖。

职位发布者:田经理

企查查科技股份有限公司

融资阶段:

公司规模:500~999人

相似职位: