团队介绍:
负责夸克搜索的基础数据收录、页面分析、内容理解、索引建库
负责夸克大模型的基础数据语料
岗位描述:
1. 参与搜索业务的离线系统与策略的研发
2. 参与大规模网页数据的采集、分析、存储及平台化建设
3. 对夸克搜索海量的网页数据进行处理和挖掘
4. 参与离线系统的性能和稳定性优化
岗位要求:
1. 具备较强的学习能力和意愿;具备良好的沟通能力,强烈的责任心和团队合作精神
2. 具备较强的编程基本功。熟悉 C++/Python/Java, 有扎实的数据结构、基础算法、网络、操作系统基础
3. 具备丰富的分布式系统开发经验、性能优化经验,有百亿以上的大规模数据处理经验
加分项:
1. 有搜索引擎效果优化经验的优先考虑,包括排序、召回、离线内容理解等
2. 有 Hadoop、Spark、Flink、HBase 等分布式计算/存储平台上的开发经验,优先考虑
3. 有大规模爬虫经验的优先考虑,包括抓取压力控制、代理、js 渲染、反封禁等
2021年4月,阿里巴巴集团成立智能信息事业群,包含夸克事业部、UC事业部、书旗事业部、智能营销平台等业务版块,核心产品为夸克App、UC浏览器、书旗小说、超级汇川广告平台等。
近两年,智能信息事业群孵化的智能搜索App夸克获得快速成长,UC浏览器、书旗小说等产品持续进化,在信息服务领域取得了不同维度的突破。智能信息事业群将集中业务资源和组织优势,聚焦智能信息服务赛道的创新机会,从用户需求出发,探索AI技术的创新应用,以“智能工具+内容”的新模式,从工具产品升级到服务平台,持续为用户提供高效、智能的互联网产品。
2021年8月至今,吴嘉担任智能信息事业群总裁。