云原生基础设施SRE

我们是蚂蚁集团云原生基础设施团队,为蚂蚁金服全集团(包括支付宝、网商、蚂蚁国际等)提供 云原生化的容器和接入服务, 团队隶属蚂蚁金服 CTO 线技术风险效能部,通过开发和使用多种平台和工具来管理好国内首屈一指、规模庞大的 Kubernetes 集群。 结合当前AIGC的趋势,利用AI和大模型孵化下一代平台产品,进一步提升工程师的用云体验和云底座的维护效率。这里工程师文化浓厚,崇尚高水平创新、反对低水平建设,已经连续三年给 KubeCon / SREcon 贡献 Topic ,并持续给相关开源社区贡献代码。

岗位内容:全方位参与云原生的资源调度系统的设计,开发,优化与维护。负责蚂蚁集团在线和实时业务的容器调度,为蚂蚁上层业务提供设施标准容器服务和全局资源动态分配调度。具体职责包括但不限于:

1. 设计调度系统高可用体系,用以保障双十一等大型活动的平稳进行

2. 标准化调度系统监控,日志采集,包括SLA的制定与故障定位

3. 建立统一额度管控,弹性伸缩调度,提升系统资源利用率

4. 建设自动化及工程化的解决方式,以减少在传统运维层面的人力投入,做到无人值守。

职位要求

1. 至少精通一门编程语言,有软件开发背景,Java/Golang优先

2. 熟悉Linux系统和 Shell,对网络及基础设施层有深入了解和知识储备

3. 有大规模k8s集群管理经验,对云平台的稳定性建设、高可用架构设计、效率提升方面有实践经验的加分

4. 熟悉监控及自动化部署平台研发,具备k8s生态二次开发经验,熟悉底层逻辑和技术细节,有建设PAAS平台相关经验的加分

5. 熟悉主流公有云 ECS、OSS、SLB、K8S 等产品基本原理及使用,对finops、istio、ebpf了解及实践的加分

6. 有良好的沟通,团队协作能力

7. 熟悉DevOps流程,理解传统运维痛点

公司地点:北京朝阳区北京朝阳区环球金融中心支付宝

公司简介:

职位发布者:谢

蚂蚁胜信(上海)信息技术有限公司

融资阶段:D轮及以上

公司规模:10000人以上

相似职位: