Python

工作内容:

1、参与分布式爬虫系统架构设计、数据库设计;

2、实现数据提取、清洗、结构化、入库、统计分析和优化工作;

3、研究优化算法,提升爬虫系统的稳定性、可扩展性;

4、参与爬虫核心算法的策略优化研究,提升抓取的效率和质量;

5、研究各种网页布局、app接口,探寻特点和规律;

6、爬虫性能提升,爬虫代理服务器开发,反爬策略研究;

7、对互联网海量业务数据进行整合、分析挖掘;

任职要求:

1、统招本科及以上学历,计算机相关专业;

2、熟悉爬虫相关技术,如:xpath/正则表达式/验证码加密处理/代理池等,具有实际爬虫开发经验;

3、熟悉Scrapy爬虫框架、Django框架、Tornado框架、Mongodb的使用;

4、熟练掌握HTIP、TCP/IP等网络传输协议工作原理;

5、熟悉ES,对query和aggs统计熟练运用;熟悉sql,熟练关联查询和分组统计;熟练抓包解包(pc端/移动端);对try-except理解深刻,有分级记录日志的习惯。

6、熟悉Linux平台环境下的开发,掌握Linux常用命令;熟悉Shell编程的优先考虑;

7、扎实的计算机基础,有较强的算法能力者优先考虑;

8、较强的数据敏感度,逻辑分析能力和文档写作能力;

公司提供五险一金、双休、每季度调薪晋级、年底双薪和绩效奖金。按照岗位性质给予交通及通讯补贴。公司有带薪年假,采取弹性工作制度。为员工提供最优质的办公条件和具有竞争机制的丰厚的薪酬体系,让您充分展现您的才能、实现您的抱负。宽松愉快的团队氛围,期待您的加入。

公司地点:石家庄·裕华区·青园

公司简介:

职位发布者:曹经理

河北趣行计算机技术有限公司

融资阶段:

公司规模:20~99人

相似职位: