中高级爬虫工程师

岗位职责

1、负责设计、开发、维护互联网数据采集相关的软件产品和模块,开发主要使用语言为Python

2、负责社交、短视频平台数据大规模采集 ;

3、负责网页信息抽取等核心算法的研究和优化;

4、负责重点目标站点的结构与URL特点分析,负责垂直领域与定向网站的数据采集、维护及数据异常的跟踪处理;

任职要求

1、大学本科及以上学历,计算机相关专业;三年以上工作经验;

2、熟悉Linux开发环境;熟练掌握Python语言;

3、熟悉网页抓取原理及技术,熟悉基于Cookie的网站登录原理,熟悉基于正则表达式、Xpath、CSS等网页信息抽取技术;

4、响应抓取需求,能快速高效的完成开发任务,具备良好的沟通能力和管理能力;

5、具备信息检索、web挖掘等搜索引擎相关知识,有从事海量网络爬虫、网页去重、网页信息抽取的开发经验;

6、工作态度踏实、认真、积极主动,能承受一定工作压力,有责任心、有团队协作能力;

7、熟悉Xposed框架、App逆向相关技术者优先;

8、有国内短视频平台或国外社交平台大规模数据采集经验。

BASE地点:天津、郑州、南京

公司地点:北京海淀区中科天玑

公司简介:

职位发布者:戴先生

中科天玑数据科技股份有限公司

融资阶段:

公司规模:

相似职位: