工作内容:
1、参与分布式爬虫系统架构设计、数据库设计;
2、实现数据提取、清洗、结构化、入库、统计分析和优化工作;
3、研究优化算法,提升爬虫系统的稳定性、可扩展性;
4、参与爬虫核心算法的策略优化研究,提升抓取的效率和质量;
5、研究各种网页布局、app接口,探寻特点和规律;
6、爬虫性能提升,爬虫代理服务器开发,反爬策略研究;
7、对互联网海量业务数据进行整合、分析挖掘;
任职要求:
1、统招本科及以上学历,计算机相关专业;
2、熟悉爬虫相关技术,如:xpath/正则表达式/验证码加密处理/代理池等,具有实际爬虫开发经验;
3、熟悉Scrapy爬虫框架、Django框架、Tornado框架、Mongodb的使用;
4、熟练掌握HTIP、TCP/IP等网络传输协议工作原理;
5、熟悉ES,对query和aggs统计熟练运用;熟悉sql,熟练关联查询和分组统计;熟练抓包解包(pc端/移动端);对try-except理解深刻,有分级记录日志的习惯。
6、熟悉Linux平台环境下的开发,掌握Linux常用命令;熟悉Shell编程的优先考虑;
7、扎实的计算机基础,有较强的算法能力者优先考虑;
8、较强的数据敏感度,逻辑分析能力和文档写作能力;
公司提供五险一金、双休、每季度调薪晋级、年底双薪和绩效奖金。按照岗位性质给予交通及通讯补贴。公司有带薪年假,采取弹性工作制度。为员工提供最优质的办公条件和具有竞争机制的丰厚的薪酬体系,让您充分展现您的才能、实现您的抱负。宽松愉快的团队氛围,期待您的加入。