爬虫工程师(Java) (MJ007489)

岗位职责:

1、负责爬虫系统的搭建和运维

2、负责web端数据的采集和风控对抗工作

岗位要求:

1、精通Java语言,至少熟练掌握主流爬虫框架中的一种,负责、搭建过Java爬虫系统者优先;

2、2年及以上实际的爬虫项目经验;

3、了解各种加密算法,在破解验证码方面有丰富经验,能够独立解决js反爬和模拟登陆问题;

4、熟悉HTML/JavaScript/CSS/xpath/url/Ajax/xml等web技知识,熟悉HttpClient、jsoup、WebDriver、phantomjs等工具;

5、熟悉linux系统,熟悉mysql、redis,nosql等,熟悉Internet基本协议(如TCP/IP. HTTP等);

6、能够解决封账号、封IP采集等问题,解决网页抓取、信息抽取等问题,构建完善的网络信息收集平台;

7、熟悉常见反爬机制,验证码识别,IP代理池、应用Ip池、headers认证和cookie等;

8、熟练掌握应用Selenium、PhantomJS、Splash、Puppeteer实施动态抓取;

9、有逆向app相关经验者优先;

10、统招本科及以上学历,计算机相关专业优先。

公司地点:北京海淀区苏州街29号院维亚大厦

公司简介:

去哪儿网是中国领先的无线和在线旅游平台,其网站上线于2005年5月,成为中国第一个旅游搜索引擎,公司总部位于北京。去哪儿网致力于建立一个为整个旅游业价值链服务的生态系统,并通过科技来改变人们的旅行方式。去哪儿网通过其自有技术平台有效匹配旅游业的供需,满足旅游服务供应商和中国旅行者的需求。对旅游服务供应商而言,去哪儿网通过移动客户端及在线平台为其提供技术基础设施;对旅行者而言,去哪儿网通过网站及移动客户端的全平台覆盖,随时随地为其提供国内外机票、酒店、度假、旅游团购、及旅行信息的深度搜索,帮助旅行者找到性价比较高的产品、较优质的信息和便捷的预订方式,聪明地安排旅行。

去哪儿是国内最早将购票功能推广到智能手机上的在线旅游平台。截至目前,全国在线旅游厂商全年交易规模指数排名第二,累计用户量近6亿,App累积下载量超过60亿,可实时搜索约9000家旅游代理商网站,覆盖全球范围内超过68万条国内及国际航线,与国内外超过100家航空公司进行了深度合作。除此之外,平台的搜索预订还覆盖了全球范围内超过200万余家酒店、120万余条度假线路、2万余个目的地门票、玩乐。

职位发布者:龙女士

北京趣拿软件科技有限公司

融资阶段:

公司规模:1000~9999人

相似职位: