1. 参与互联网网页、文档、图片等内容数据的发现、采集及解析
2. 优化爬虫架构,完善爬虫平台能力,提升系统稳定性及业务支持效率
3. 优化js渲染性能,提升爬虫对抗能力,完善网页渲染及内容解析效果
职位描述
1. 编程基本功扎实、熟悉常用数据结构和算法,有大规模、分布式数据处理的经验
2. 熟悉爬虫及网页处理技术,有浏览器内核开发及爬虫对抗经验的优先考虑
3. 对搜索业务及相关行业有较深理解的优先考虑
2021年4月,阿里巴巴集团成立智能信息事业群,包含夸克事业部、UC事业部、书旗事业部、智能营销平台等业务版块,核心产品为夸克App、UC浏览器、书旗小说、超级汇川广告平台等。
近两年,智能信息事业群孵化的智能搜索App夸克获得快速成长,UC浏览器、书旗小说等产品持续进化,在信息服务领域取得了不同维度的突破。智能信息事业群将集中业务资源和组织优势,聚焦智能信息服务赛道的创新机会,从用户需求出发,探索AI技术的创新应用,以“智能工具+内容”的新模式,从工具产品升级到服务平台,持续为用户提供高效、智能的互联网产品。
2021年8月至今,吴嘉担任智能信息事业群总裁。