跳到主要内容

驾驶舱

驾驶舱是一项提供租户维度、集群维度的资源监控大屏展示的模块,让用户从统一视图了解平台资源监控情况。

提供开箱即用的监控板块,方便管理员快速查看资源的使用情况与状态,帮助降低企业运维成本。

提供丰富的图表展现形式,并支持全屏展示和数据自动刷新。用户可以在一张监控大盘中查看整体监控数据,实现重要监控指标集中展现,满足监控数据可视化需求。

备注

全局驾驶舱和项目集群驾驶舱都是仅系统管理员、平台管理员有权限。

全局驾驶舱

全局驾驶舱是全局资源的集中展示,有权限的用户可以点击[所有产品/安全和运维/大屏驾驶舱]获取平台资源运行状态,页面显示如下图所示。

test

全局驾驶舱统计展示的信息如下表所示。

模块模块说明
云资产平台相应云资源统计,支持按照应用、容器、服务、节点筛选
用户平台用户总数和当前租户的用户数
集群状态每个集群的状态监控,排序方式:集群异常,集群正常
全局系统服务全局系统服务的状态监控
流水线流水线数量统计
集群系统服务每个集群系统服务状态统计
  • 如果一个集群系统服务全部正常,显示绿色
  • 如果一个集群系统服务有异常,显示红色
  • 服务告警统计30分钟内,项目-集群下的告警数量,数量为0时,绿色,大于0,红色
    流量监控(HAproxy)经过HAproxy出口的入站、出站流量监控(使用集群网络出口的应用),支持筛选集群
    流量监控(Ingress)经过Ingress出口的入站、出站流量监控(使用应用负载均衡的应用),支持筛选集群
    CPU监控所有集群CPU使用率监控
    内存监控所有集群内存使用率监控
    存储使用量整个集群的存储使用量,支持筛选集群
    项目项目数量统计:
  • 平台中创建的项目的总计数
  • 未授权集群项目:没有授权集群的项目的计数
  • 代码项目激活代码项目统计
    流水线执行失败率排行执行失败率较高流水线统计:
  • ≥80%,显示红色
  • 80%>失败率≥70%,显示橙色
  • 70%>失败率≥60%,显示黄色
  • 60%>失败率≥50%,显示蓝色
  • <50%,显示绿色
  • 流水线任务失败率排行执行失败率较高任务类型统计:
  • ≥80%,显示红色
  • 80%>失败率≥70%,显示橙色
  • 70%>失败率≥60%,显示黄色
  • 60%>失败率≥50%,显示蓝色
  • <50%,显示绿色
  • 项目-集群驾驶舱

    项目-集群驾驶舱是某项目,某集群资源的集中展示,有管理员权限的用户可以点击[所有产品/安全和运维/大屏驾驶舱],切换至“项目-集群驾驶舱”查看集群资源情况。

    test

    项目/集群驾驶舱统计展示的信息如下表所示。

    模块模块说明
    CPU整个集群的CPU平均使用率监控
    资源概览项目-集群资源概览
    内存整个集群的内存平均使用率监控
    HAproxy项目-集群维度,经过HAproxy的流量监控
    Ingress项目-集群维度,经过Ingress的流量监控
    请求CPU最多工作负载请求CPU最多工作负载排行,包含Deployment、Statefulset、Job资源
    请求内存最多工作负载请求内存最多工作负载排行,包含Deployment、Statefulset、Job资源
    资源配额所有项目集群维度配额,按资源配额使用比例排序,大于90%的进度条显示红色,否则蓝色;默认字母顺序排序
    Pod CPU使用率排行Pod资源CPU使用率排行,不同使用率显示不同颜色。
  • ≥90%,显示红色
  • 90%≥使用率≥70%,显示黄色
  • <70%,显示绿色
  • Pod内存使用率排行Pod资源内存使用率排行,不同使用率显示不同的颜色。
  • ≥90%,显示红色
  • 90%≥使用率≥70%,显示黄色
  • <70%,显示绿色
  • 资源告警统计30分钟内服务资源告警、日志告警
    集群节点状态集群节点状态统计正常&开启调度,正常&禁止调度,异常
    集群系统服务集群系统服务监控,例如:右上角11/12表示总容器数12个,运行正常容器数11个。点的颜色:
  • 全部正常,显示绿色
  • <100%,显示红色
  • 中间环图显示运行中容器百分比,下方的具体服务(容器状态x/x)
  • 一个服务的容器存在异常,显示红色(0/x)
  • 全部正常,显示绿色(x/x)
  • 红色>绿色(从上往下),相同颜色按字母顺序排序
  • 容器健康率集群和节点容器健康率统计,容器健康率=运行状态容器/总数,统计全集群的健康率和每个节点的健康率,颜色梯度:
  • ≥70%,显示绿色
  • 70%≥健康率≥50%,显示橙色
  • <50%,显示红色按健康率从小到大排序
  • 镜像仓库服务镜像仓库信息统计
    Spring Cloud组件状态Spring Cloud组件状态,组件排序,异常>启动失败>启动中>正常
    Spring Cloud请求失败率排行Hystrix组件的微服务请求失败率排行,从大到小排序
    Spring Cloud熔断时间排行Hystrix组件的微服务,处于熔断状态线程池的熔断持续时间排行,按时间从大到小排序
    插件状态集群插件状态:正常、异常、启动中、启动失败、未安装