跳到主要内容

API告警

用户可以自定义API告警策略,及时了解API网关服务运行状况,从而起到预警的作用。API网关支持资源告警。

资源告警

资源告警指对API监控指标的告警,包括:请求次数、单位时间请求次数、数据流量、调用延时、出错次数、单位时间内出错次数、Kong服务调用延时、源服务调用延时等,具体的说明如下所示。

告警指标含义统计周期取值范围告警维度
API响应时间该指标用于统计API接口响应延时时间2分钟、5分钟、15分钟、30分钟、60分钟总和/平均值/最大值/最小值大于或者小于设定阈值单位:ms单个API
API请求次数该指标用于统计API接口请求流量2分钟、5分钟、15分钟、30分钟、60分钟总和/平均值/最大值/最小值大于或者小于设定阈值单位:count单个API
流入带宽该指标用于统计API接口请求流量2分钟、5分钟、15分钟、30分钟、60分钟总和/平均值/最大值/最小值大于或者小于设定阈值单位:KB单个API
流出带宽该指标用于统计API接口返回流量2分钟、5分钟、15分钟、30分钟、60分钟总和/平均值/最大值/最小值大于或者小于设定阈值单位:KB单个API
Code4xx该指标用于统计API接口返回4xx错误的次数2分钟、5分钟、15分钟、30分钟、60分钟总和/平均值/最大值/最小值大于或者小于设定阈值单位:count单个API
Code5xx该指标用于统计API接口返回5xx错误的次数2分钟、5分钟、15分钟、30分钟、60分钟总和/平均值/最大值/最小值大于或者小于设定阈值单位:count单个API
kong服务调用延时该指标用于统计API请求在Kong服务调用的响应时间2分钟、5分钟、15分钟、30分钟、60分钟总和/平均值/最大值/最小值大于或者小于设定阈值单位:ms单个API
后端服务调用延时该指标用于统计后端服务的响应时间2分钟、5分钟、15分钟、30分钟、60分钟总和/平均值/最大值/最小值大于或者小于设定阈值单位:ms单个API
后端服务健康检查-不健康后端服务开启不健康探测策略后,当检测为不健康时进行告警API分组即后端服务

后端服务健康检查为不健康进行告警时,可选择告警后处理,是否自动下线此服务已发布的所有API。

(1) 用户登录容器云平台,选择[运维中心/应用监控/应用告警/告警设置]菜单项,切换至“资源告警”页签。

(2) 单击<创建告警策略>按钮,进入告警策略配置页面,配置所需的参数,具体的参数说明如下所示。

  • 产品:选择关注的产品,可选的有容器服务、中间件、API网关。
  • 告警等级:设置当前资源告警的告警等级,可选的等级有通知、告警、危险。
  • 通知间隔:两次通知之间的间隔。此间隔时间内,任意策略同一指标触发告警多次,只发送一次通知。
  • 告警对象:当前租户下所有的API分组。
  • 告警服务:当前租户已发布的API。

(3) 参数配置完成后,示例页面如下图所示,单击<下一步>按钮。

test

(4) 进入告警规则配置页面,选择关注的资源项目,配置告警阈值,如下图所示。

test

(5) 配置完成后,单击<下一步>按钮,进入告警行为配置页面,配置对应的告警行为,如下图所示。

test

(6) 选择容器云平台已有的通知组或者新建所需的通知组,单击<提交>按钮,资源告警创建。