岗位职责
1、负责设计、开发、维护互联网数据采集相关的软件产品和模块,开发主要使用语言为Python
2、负责社交、短视频平台数据大规模采集 ;
3、负责网页信息抽取等核心算法的研究和优化;
4、负责重点目标站点的结构与URL特点分析,负责垂直领域与定向网站的数据采集、维护及数据异常的跟踪处理;
任职要求
1、大学本科及以上学历,计算机相关专业;三年以上工作经验;
2、熟悉Linux开发环境;熟练掌握Python语言;
3、熟悉网页抓取原理及技术,熟悉基于Cookie的网站登录原理,熟悉基于正则表达式、Xpath、CSS等网页信息抽取技术;
4、响应抓取需求,能快速高效的完成开发任务,具备良好的沟通能力和管理能力;
5、具备信息检索、web挖掘等搜索引擎相关知识,有从事海量网络爬虫、网页去重、网页信息抽取的开发经验;
6、工作态度踏实、认真、积极主动,能承受一定工作压力,有责任心、有团队协作能力;
7、熟悉Xposed框架、App逆向相关技术者优先;
8、有国内短视频平台或国外社交平台大规模数据采集经验。
BASE地点:天津、郑州、南京