岗位职责:
1、负责公司的爬虫核心技术研究,爬虫框架架构,策略优化;
2、配合Leader对爬虫团队的开发任务进行管理工作,包括代码质量、代码优化、研发任务等管理;
3、根据业务需求,实现大规模文本、图片、视频数据抓取、清洗、存储等工作;
4、了解并掌握对常用或者疑难反爬解决方案;
5、熟悉常规的风控机制,并能绕过大部分风控;
6、热衷于编程,能吃苦耐劳。
7、对常用爬虫框架如Scrapy、Celery等有深入的研究,具有框架优化能力;
8、熟悉存储中间件以及mysql、mongodb等优化措施;
任职要求:
1、计算机、数学或统计等相关专业,5年以上数据相关工作经验;
2、熟悉linux平台,熟悉Python编程语言;
3、熟悉主流爬虫框架以及对爬虫分布式有相关研究;
4、熟悉基于正则表达式、CSS、http协议、ml等的网页信息抽取技术;
5、具有钻研精神,对数据驱动业务有深入理解,对数据与业务方面有足够的敏感性,独立思考能力和逻辑分析能力强。
6、熟悉Frida等hook工具
7、熟练掌握代码(网页端、移动端)动态跟踪调试等破解技术
加分项:
1、拥有大型企业内外网完整渗透测试经验,对实战攻防有深入研究或实践经验
2、独立挖掘过Java等开源程序0day漏洞
3、提交过原创漏洞,发布过攻防技术文章;攻防比赛荣誉、SRC排名;github开源项目等
4、具备高级信息系统项目管理师资质