岗位要求:
1. 计算机科学、信息技术或相关专业的学士学位,或具有相关工作经验
2. 精通Python等至少一种程序语言,具有使用scrapy,BeautifulSoup等爬虫工具的经验
3. 理解HTML,Css,JavaScript及Web浏览器DOM结构。
4. 熟悉网络爬中技术,包括动态页面抓取、反封锁/P代理等
5. 对大数据处理和存储有一定的了解和实践,比Hadoop,spark,MongoDB等
6. 具备良好的问题解决能力,能独立处理问题,并有持续学习和自我提升的动力。
7. 对数据抓取的合法性、道德性等有深厚的理解,能制定和遵循严格的数据抓取原则。