硬性要求:爬虫(java/python)+js逆向
岗位职责:
1. 遵守robots协议,采集互联网上公开的信息,以满足各种业务的数据需求;
2. 负责设计和开发分布式网络爬虫系统,执行多平台的信息抓取和分析;
3. 负责进行网页信息和APP数据的抽取、清洗、去重等工作,提高平台的抓取效率;
4. 协助团队解决爬虫技术上的难题,提升大规模数据系统的抓取效果和性能。
5. 跟踪和了解行业最新的爬虫技术和工具,并实践应用在工作中。
任职要求:
1. 拥有2年以上的数据采集或解析相关开发经验,熟练掌握HTTP协议、正则表达式、多线程等概念;
2. 熟悉网络协议,理解Web相关技术原理和数据抽取技术;
3. 理解爬虫原理,熟悉常用反爬虫技术,具有爬虫项目开发经验者优先考虑;
4. 思维活跃,能积极推动爬虫项目的进展,解决技术问题;
5. 熟悉多种爬虫框架和工具,如Scrapy、Beautiful Soup、webmagic等,熟练使用selenium、requests、httplib2、Jsoup等常用数据采集模块;
6. 具有大规模数据处理、数据挖掘、信息提取的经验者优先;
博彦科技(深交所上市公司, 股票代码002649)是亚太领先的全方位IT服务及行业解决方案提供商,具备全球范围内的交付能力。博彦科技创立于1995年,员工20000多人, 是中国IT行业的先行者和领军企业,拥有完善、成熟的管理和开发流程,确保为客户提供高质量的服务。公司全球总部设在北京中关村,在上海、深圳、广州、武汉、天津、西安、大连、成都已经设立研发中心,在美国硅谷、西雅图、洛杉矶,日本东京、新加坡、加拿大、印度、台湾、香港等国家和地区设立了全资子公司。博彦科技依托自身强大的研发与创新能力,广泛采用基于大数据,云计算和移动互联等新兴技术,为高科技、互联网、金融、汽车、能源、制造、医疗、电信、媒体、旅游等行业客户提供丰富的解决方案和产品。我们期待您的加盟,博彦会为您提供广阔的发展空间,提升自身价值的加速动力,热切欢迎有志之士!