配置数据源管理的告警规则
数据源管理的告警规则只能使用 Grafana Mimir 或 Grafana Loki 数据源创建。
这些规则存储在数据源中。在分布式架构中,它们可以水平扩展以提供高可用性。有关更多详细信息,请参阅告警规则类型。
我们建议尽可能使用Grafana 管理的告警规则,并在需要扩展告警设置时选择数据源管理的告警规则。
当通过告警 UI 管理告警启用时,来自 Prometheus 数据源的规则会出现在告警规则页面的数据源管理的部分。
然而,Grafana 只能为 Mimir 和 Loki 创建和编辑数据源管理的规则,而不能为 Prometheus 实例创建和编辑。
要创建或编辑数据源管理的告警规则,请按照以下说明进行操作。
开始之前
验证你对 Mimir 或 Loki 数据源具有写入权限。否则,你无法创建或更新数据源管理的告警规则。
启用 Ruler API
有关更多信息,请参阅 Mimir Ruler API 或 Loki Ruler API。
Mimir - 使用
/prometheus
前缀。Prometheus 数据源同时支持 Grafana Mimir 和 Prometheus,Grafana 期望 Query API 和 Ruler API 在同一 URL 下。你无法为 Ruler API 提供单独的 URL。Loki -
local
规则存储类型(Loki 数据源的默认类型)仅支持查看规则。要编辑规则,请配置其他规则存储类型之一。
权限
具有Editor或Admin角色的用户可以编辑或删除 Mimir 或 Loki 实例的告警规则。
如果你不想管理特定数据源的告警规则,请转到其设置并取消选中通过告警 UI 管理告警复选框。
配置 (Provisioning)
请注意,如果你删除了在 UI 中创建的告警资源,则无法再找回它。
要备份和管理告警规则,你可以使用配置文件、Terraform 或告警 API 等选项来配置告警资源。
设置告警规则名称
点击告警与 IRM -> 告警规则 -> + 新建告警规则。
输入名称以标识你的告警规则。
此名称将显示在告警规则列表中。它也是从此规则创建的每个告警实例的
alertname
标签。
定义查询和条件
定义一个查询以获取你要测量的S数据,并定义一个在触发告警规则之前需要满足的条件。
注意
默认情况下,新的告警规则由 Grafana 管理。要切换到数据源管理的,请按照以下说明进行操作。
从下拉列表中选择一个基于 Prometheus 的数据源。
你还可以点击打开高级数据源选择器以查找更多选项。
输入 PromQL 或 LogQL 查询,包括告警条件。
在规则类型选项中,选择数据源管理的。
点击预览告警。
设置告警评估行为
使用告警规则评估来确定告警规则的评估频率以及状态变化的快慢。
选择一个命名空间或点击+ 新建命名空间。
选择一个评估组或点击+ 新建评估组。
如果你要创建新的评估组,请指定该组的间隔。
同一组中的所有规则在同一时间间隔内按顺序评估。你可以在告警规则页面重新排序它们。
输入待处理周期。
待处理周期是指告警规则在触发之前可以违反条件的时间段。
一旦满足条件,告警将进入待处理状态。如果条件在指定持续时间内保持活动状态,则告警转换为触发中状态,否则恢复为正常状态。
配置标签和通知
为你的告警规则添加标签,以设置哪个通知策略应该处理你的触发中告警实例。
所有告警规则和实例,无论其标签如何,都匹配默认通知策略。如果没有嵌套策略,或者没有嵌套策略与告警规则或告警实例中的标签匹配,则默认通知策略是匹配的策略。
如果你想更改通知的路由方式,请添加标签。
通过从下拉列表中选择现有的键值对来添加自定义标签,或通过输入新的键或值来添加新的标签。
配置通知消息
使用标注为告警消息添加有助于响应告警的信息。
标注默认包含在通知消息中,可以使用文本或模板显示查询中的动态数据。
Grafana 提供了几个可选标注。
可选:添加摘要。
简短概述发生了什么以及原因。
可选:添加描述。
描述告警规则的作用。
可选:添加 Runbook URL。
你存放告警 Runbook 的网页
可选:添加自定义标注。
添加任何有助于处理告警的额外信息。
可选:链接仪表盘和面板。
将告警规则链接到面板,以方便告警调查。
点击保存规则。