职位描述
1、开发极高数据量级Spider系统的实时计算、调度分发、压力控制、蜘蛛抓取等服务
2、跟进业界技术趋势,推动新技术、新方法在 spider、建库、检索系统架构应用落地
职位要求
1、具备扎实的计算机理论基础、出色的编码能力,熟悉Python或Java等编程语言、出色的数据结构和基础算法功底;
2、熟悉数据挖掘,对网页抓取/页面解析等有经验
3、有参与或者负责搭建全网搜索引擎/spider系统经验优先