负责设计和开发高效稳定的网络爬虫系统,完成数据采集、清洗和存储;
解决反爬机制(如验证码、IP封禁、动态加密等),优化爬虫性能与稳定性;
参与数据抓取策略制定,提升爬虫效率及数据质量;
维护现有爬虫系统,监控运行状态并快速排查问题;
配合团队完成数据分析和处理相关需求。
任职要求:
1年以上Python开发经验,熟练使用requests、Scrapy、BeautifulSoup、Selenium等工具;
熟悉HTTP/HTTPS协议、WebSocket及常见反爬技术(如User-Agent轮换、代理IP、请求频率控制等);
掌握XPath/CSS选择器、正则表达式等数据提取技术;
了解数据库(MySQL/MongoDB/Redis)及分布式爬虫框架(如Scrapy-Redis);
有APP逆向分析经验(如Charles/Fiddler抓包、Hook技术)者优先。
其他要求:
熟悉多线程/协程(asyncio)、分布式爬虫开发;
了解基本的数据结构和算法;
具备良好的代码规范和文档习惯,能独立解决问题;
对数据敏感,有数据分析经验者加分。
加分项:
熟悉JavaScript逆向或AST技术;
有大规模数据采集(千万级以上)经验;
了解机器学习在爬虫中的应用(如验证码识别)。
职位描述:
负责设计和开发高效稳定的网络爬虫系统,完成数据采集、清洗和存储;
解决反爬机制(如验证码、IP封禁、动态加密等),优化爬虫性能与稳定性;
参与数据抓取策略制定,提升爬虫效率及数据质量;
维护现有爬虫系统,监控运行状态并快速排查问题;
配合团队完成数据分析和处理相关需求。
任职要求:
1年以上Python开发经验,熟练使用requests、Scrapy、BeautifulSoup、Selenium等工具;
熟悉HTTP/HTTPS协议、WebSocket及常见反爬技术(如User-Agent轮换、代理IP、请求频率控制等);
掌握XPath/CSS选择器、正则表达式等数据提取技术;
了解数据库(MySQL/MongoDB/Redis)及分布式爬虫框架(如Scrapy-Redis);
有APP逆向分析经验(如Charles/Fiddler抓包、Hook技术)者优先。
其他要求:
熟悉多线程/协程(asyncio)、分布式爬虫开发;
了解基本的数据结构和算法;
具备良好的代码规范和文档习惯,能独立解决问题;
对数据敏感,有数据分析经验者加分。
加分项:
熟悉JavaScript逆向或AST技术;
有大规模数据采集(千万级以上)经验;
了解机器学习在爬虫中的应用(如验证码识别)。
职位描述:
负责设计和开发高效稳定的网络爬虫系统,完成数据采集、清洗和存储;
解决反爬机制(如验证码、IP封禁、动态加密等),优化爬虫性能与稳定性;
参与数据抓取策略制定,提升爬虫效率及数据质量;
维护现有爬虫系统,监控运行状态并快速排查问题;
配合团队完成数据分析和处理相关需求。
任职要求:
1年以上Python开发经验,熟练使用requests、Scrapy、BeautifulSoup、Selenium等工具;
熟悉HTTP/HTTPS协议、WebSocket及常见反爬技术(如User-Agent轮换、代理IP、请求频率控制等);
掌握XPath/CSS选择器、正则表达式等数据提取技术;
了解数据库(MySQL/MongoDB/Redis)及分布式爬虫框架(如Scrapy-Redis);
有APP逆向分析经验(如Charles/Fiddler抓包、Hook技术)者优先。
其他要求:
熟悉多线程/协程(asyncio)、分布式爬虫开发;
了解基本的数据结构和算法;
具备良好的代码规范和文档习惯,能独立解决问题;
对数据敏感,有数据分析经验者加分。
加分项:
熟悉JavaScript逆向或AST技术;
有大规模数据采集(千万级以上)经验;
了解机器学习在爬虫中的应用(如验证码识别)。