工作职责:
1.负责持续跟踪分析爬虫系统的技术缺陷,对策略架构做出合理地调整和改进,提升公司相关产品与服务的竞争力
2.完成对指定网站的信息采集配置及维护工作;
3、负责网页信息抽取等研发和优化工作。
任职资格:
1. 计算机科学与技术、软件工程等相关专业;
2. 熟悉linux平台,有一年以上Python编程经验,熟悉xpath、正则表达式等知识;
3. 常见网站的反爬技术如js加密混淆等;
4. 熟悉Web等数据抓取的工作原理及流程;
5. 具有优秀的团队合作和沟通协作能力,善于学习,乐于分享,能承受较大工作压力;
6. 熟练使用Mysql/MongoDB/Redis者优先。
7. 有今日头条、微信、汽车之家、裁判文书、百度百家号等重点数据大规模采集经验者优先;
该岗位为内部编制岗位,请候选人放心投递。