【注:岗位base在苏州总部】
【注:岗位base在苏州总部】
【注:岗位base在苏州总部】
高亮:岗位后期必定会验证【学历】、【薪资】、【履历】,希望同学们诚信求职。
工作职责:
1、独立完成各类网站数据采集任务,保障数据的准确性与时效性
2、持续优化网页信息抽取规则,提高网页抓取效率、质量等问题
3、监控采集系统运行,维护日常采集任务状态。
硬性技能:
1、 熟悉基于XPath、CSS等网页信息抽取技术
2、熟悉关系型和非关系型数据库
3、熟练使用python,了解scrapy框架
4、熟悉网页抓取原理及技术,了解基本网络协议
核心素质:
1、自主驱动型成长:保持技术敏感度,主动追踪爬虫领域新技术新方法
2、问题终结者:对数据偏差零容忍,具备从现象定位到根因分析的解决能力
3、交付可靠性:具备任务优先级管理能力,承诺时效内确保高质量交付
4、技术钻研精神:乐于研究网站架构特点,持续优化采集策略
加分项(非必需):
• 了解分布式爬虫架构(Scrapy-Redis/Scrapy-Cluster)
• 有JS逆向/安卓逆向相关经验
我们提供:
» 完备的爬虫技术体系培训(动态渲染破解/验证码绕过/IP代理策略等)
» 参与千万级数据采集项目的实战机会
» 技术大牛成长指导,快速构建爬虫工程师核心能力
企查查创立于2014年3月,总部位于苏州,是一家拥有海量企业信息、全面维度数据、庞大终端用户的创新公司,成立初始便被评定为国家高新技术企业。公司专注于大数据挖掘,数据建模,行业标准定义和可视化分析技术等领域。依赖超强研发实力,打造了国内首款企业信用信息查询应用——企查查APP。
企查查平台基于完全公开的全国工商信息、诉讼信息、知识产权信息等,对数据进行结构化整理,为用户提供免费的一站式查询服务。同时,通过对数据的深度分析,挖掘企业、高管之间的关联关系,帮助普通用户快速掌握企业征信能力,详实了解合作公司,预防潜在风险。并且,企查查也为B端用户提供SaaS平台、数据定制等专属服务,为企业经营、风险监控等提供数据支撑。
企查查涵盖全球超5.5亿家企业数据,汇集了目前国内市场中的80个产业链,8000个行业,6000个市场,工商数据 3亿+,司法案件 1.8亿+,新闻舆情 3.8千万,知识产权 1.7亿,招投标1.1亿+。目前用户量超5亿,累积查询量超10万亿次。企查查品牌更是被认定为名牌商标,深受社会各界的认可和赞许,连续多年入选中国互联网综合实力百强企业,并成为商查行业首个中国独角兽企业。
随着市场加速扩张,企查查也走得愈发稳健,中国信通院《企业信用大数据行业发展研究报告》显示,企业信用数据行业市场规模已达千亿元,企查查在“用户规模、数据体量、用户粘性”等方面居于行业第一。并且,在信息安全、合规方面,企查查获得了公安部计算机信息安全等级保护3级认证、央行征信备案机构等资质认证。
2023年5月,企查查发布全球首款商查大模型——知彼阿尔法,同月获“中国智能科学技术最高奖”吴文俊人工智能科学技术奖。