配置数据源管理的警报规则
为已配置规则创建的格拉夫纳 Mimir 或 Loki 数据源创建数据源管理的警报规则。
要配置您的格拉夫纳 Mimir 或 Loki 数据源以创建警报规则,请启用 Loki Ruler API 或 Mimir Ruler API。
有关更多信息,请参阅 Loki Ruler API 或 Mimir Ruler API。
注意:
具有编辑器或管理员角色的用户可以编辑或删除格拉夫纳 Mimir 或 Loki 实例的警报规则。
如果您在 UI 中删除了创建的警报资源,您将无法再检索它。为了备份您的配置并能够恢复已删除的警报资源,请使用文件配置、Terraform 或警报 API 创建警报资源。
开始之前
请确认您有对 Mimir 或 Loki 数据源的写入权限。否则,您无法创建或更新格拉夫纳 Mimir 或 Loki 管理的警报规则。
启用 Mimir 或 Loki Ruler API。
观看此视频了解如何创建 Mimir 管理的警报规则
这里应该有一个视频,但不知何故没有。要么是我们输入的ID错了(啊!),要么是Vimeo出了问题。如果是后者,我们预计他们很快就会恢复。在此期间,查看我们的博客!
注意
如果您不想管理特定Loki或Mimir数据源的警报规则,请进入其设置并取消勾选通过警报UI管理警报。
要创建数据源管理的警报规则,请使用产品内的警报创建流程,并按照以下步骤进行。
设置警报规则名称
点击警报 & IRM -> 警报规则 -> + 新建警报规则。
输入一个名称以标识您的警报规则。
此名称在警报规则列表中显示。它也是从该规则创建的每个警报实例的
alertname
标签。
定义查询和条件
定义一个查询以获取您想要测量的数据,以及一个在触发警报规则之前必须满足的条件。
注意:
默认情况下,所有警报规则都由Grafana管理。要切换到数据源管理的警报规则,请点击切换到数据源管理的警报规则。
从下拉列表中选择一个数据源。
您还可以点击打开高级数据源选择器以查看更多选项,包括添加数据源(仅管理员)。
输入PromQL或LogQL查询。
点击预览警报。
设置警报评估行为
使用警报规则评估来确定警报规则应该多久评估一次以及其状态应该多快改变。
选择一个命名空间或点击+ 新建命名空间。
选择一个评估组或点击+ 新建评估组。
如果您正在创建新的评估组,请指定组的间隔。
同一组内的所有规则在相同的时间间隔内依次评估。
输入待处理期。
待处理期是警报规则在触发之前违反条件可以持续的时间段。
一旦满足条件,警报将进入待处理状态。如果条件在指定的时间内保持活跃,则警报将转换为触发状态,否则将恢复到正常状态。
配置通知
向您的警报规则添加标签以设置应处理触发警报实例的哪些通知策略。
无论其标签如何,所有警报规则和实例都与默认通知策略匹配。如果没有嵌套策略,或者没有嵌套策略与警报规则或警报实例中的标签匹配,则默认通知策略是匹配的策略。
添加标签以更改通知路由方式。
通过从下拉列表中选择现有键值对或输入新的键或值来添加自定义标签。
添加注释
添加注释到警报通知中提供更多上下文。
注释添加元数据以提供有关警报的更多信息。例如,添加一个摘要注释来告诉您哪个值触发了警报或它发生在哪个服务器上。
可选:添加摘要。
事件简要概述及其原因。
可选:添加描述。
警报规则的功能描述。
可选:添加运行手册URL。
存储警报运行手册的网页
可选:添加自定义注释
可选:链接仪表板和面板。
将警报规则链接到面板,以便于警报调查。
点击 保存规则。