运维工程师

职位描述

1、理解公司产品的基础架构,负责和鲸科技ModelWhale平台在公有云和私有化场景下的独立部署和调试;

2、负责私有化环境的维护及用户对于基础设施的相关技术支持;

3、负责私有化交付产品的编排/部署优化/更新等;

职位要求

1、本科计算机相关专业;

2、熟悉常规服务器硬件、Linux/Unix系统、网络、存储系统等相关知识,具有较强的问题排查能力和问题解决能力以及问题记录复盘能力;

3、熟悉k8s基础高可用方案,能使用各种工具针对不同环境快速部署稳定高可用的k8s集群

4、熟悉 Helm,能够熟练的使用helm工具新建/新增/编排/部署/更新微服务;

5、熟悉Shell/golang/python中至少一种开发语言,有基础的相关容器日志排查经验;

6、熟悉各大公有云的环境,特别是各个云厂商提供的 k8s 服务,能够灵活的适配各公有云/私有云进行产品交付;

7、熟悉Linux系统,熟悉kubenetes及docker/container的生态,具备较强的生产环境运维经验;

8、熟悉Prometheus,Grafana,Loki,等日志收集指标监控等工具;

9、熟悉以下数据库中间件的备份恢复操作Mongodb、Postgres、redis、minio/s3;

10、了解NVIDIA GPU的容器调度方式,清楚如何从0搭建一套容器化GPU调度集群;

11、有良好的沟通能力,学习能力和团队合作精神,极强的工作责任心,能承担一定的工作压力;

12、能够接受一定程度的出差。

加分项: 有项目管理经验 有多种类型项目经验者优先,包括但不限于国企/央企/民营企业/集团

公司地点:上海徐汇区光启园5号楼101和鲸科技

公司简介:

和鲸科技成立于2015年,是国内领先的数据智能科技企业,以“Connect People with Data 人与数据的价值连接”为使命,志在与开拓者同行,以“协同平台+实践社区+竞赛”三位一体的数据科学与人工智能基础设施建设体系,助力各行各业打通数据的价值闭环,实现 AI 赋能应用落地。客户覆盖气象、教育、医疗、航空航天、金融、通信、能源、零售等领域,与众多高校、科研机构、企业等单位展开了深度合作。

ModelWhale数据科学协同平台,和鲸自主研发的数据科学生产力工具。基于ModelOps 理念,深度融合计算基础设施、模型开发环境与团队协同管理,打通数据、算力、模型、成果应用全流程,为数据驱动型组织提供一站式数据分析与AI开发服务,加速组织数智化升级。

和鲸社区,国内头部数据科学实践社区,以海量数据资源、实战案例、学习资源与丰富的数据科学实训活动,汇聚了大量数据科学从业者及爱好者,在社区一起分享、交流、协作,在实践中快速成长。

和鲸科赛,一站式专业数据科学竞赛解决方案, 提供完备、友好的竞赛管理系统与专业的数据竞赛运营服务,链接赛事各方,让办赛更轻松、更高效、更专业!帮助政府、企业、高校,通过数据竞赛,推动人才招募、品牌建设、数据开放,借助数据竞赛,培养懂业务、懂数据、会创新的“复合型人才”。

职位发布者:叶经理

上海和今信息科技有限公司

融资阶段:

公司规模:20~99人

相似职位: