配置数据源管理的警报规则
为已配置为支持规则创建的 Grafana Mimir 或 Grafana Loki 数据源创建数据源管理的警报规则。
要为您的 Grafana Mimir 或 Loki 数据源配置警报规则创建,请启用 Loki Ruler API 或 Mimir Ruler API。
有关更多信息,请参阅 Loki Ruler API 或 Mimir Ruler API。
注意:
Grafana Mimir 或 Loki 实例的警报规则可以由具有编辑器或管理员角色的用户编辑或删除。
如果您删除了在 UI 中创建的警报资源,则无法再检索它。要备份您的配置并能够恢复已删除的警报资源,请使用文件配置、Terraform 或警报 API 创建您的警报资源。
在您开始之前
验证您对 Mimir 或 Loki 数据源具有写入权限。否则,您无法创建或更新 Grafana Mimir 或 Loki 管理的警报规则。
启用 Mimir 或 Loki Ruler API。
观看此视频,了解有关如何创建 Mimir 管理的警报规则的更多信息
注意
如果您不想为特定的 Loki 或 Mimir 数据源管理警报规则,请转到其设置并清除 通过警报 UI 管理警报 复选框。
要创建数据源管理的警报规则,请使用产品内的警报创建流程并遵循以下步骤来帮助您。
设置警报规则名称
点击 警报和 IRM -> 警报规则 -> + 新警报规则。
输入一个名称来标识您的警报规则。
此名称显示在警报规则列表中。它也是从该规则创建的每个警报实例的
alertname
标签。
定义查询和条件
定义一个查询以获取您要衡量的数据,以及在警报规则触发之前需要满足的条件。
注意:
默认情况下,所有警报规则都由 Grafana 管理。要切换到数据源管理的警报规则,请点击 切换到数据源管理的警报规则。
从下拉列表中选择一个数据源。
您也可以点击 打开高级数据源选择器 以查看更多选项,包括添加数据源(仅限管理员)。
输入 PromQL 或 LogQL 查询。
点击 预览警报。
设置警报评估行为
使用警报规则评估来确定警报规则应多久评估一次以及它应多久改变一次状态。
选择一个命名空间或点击 + 新命名空间。
选择一个评估组或点击 + 新评估组。
如果您要创建一个新的评估组,请指定该组的间隔。
同一组中的所有规则都在同一时间间隔内按顺序评估。
输入一个待处理时间段。
待处理时间段是警报规则可以违反条件直到触发的时间段。
一旦条件满足,警报就会进入 待处理 状态。如果条件在指定的时间段内保持活动状态,则警报会过渡到 触发 状态,否则会恢复到 正常 状态。
配置通知
为您的警报规则添加标签以设置应处理触发警报实例的通知策略。
所有警报规则和实例,无论其标签如何,都匹配默认通知策略。如果没有嵌套策略,或者没有嵌套策略与警报规则或警报实例中的标签匹配,则默认通知策略是匹配策略。
如果您想更改通知的路由方式,请添加标签。
通过从下拉菜单中选择现有的键值对来添加自定义标签,或通过输入新的键或值来添加新标签。
添加注释
添加 注释 以在您的警报通知中提供有关警报的更多上下文。
注释添加元数据以在您的警报通知中提供有关警报的更多信息。例如,添加一个 **Summary** 注释以告诉您哪个值导致警报触发或它发生在哪个服务器上。
可选:添加摘要。
简短概述发生了什么以及原因。
可选:添加描述。
描述警报规则的作用。
可选:添加 Runbook URL。
您保存警报 Runbook 的网页。
可选:添加自定义注释
可选:添加 **仪表盘和面板链接**。
将警报链接到仪表盘中的面板。
试试 Grafana Play
使用 Grafana Play,您可以探索并查看它的工作原理,从实际示例中学习以加速您的开发。此功能可以在 Grafana 中具有链接警报的可视化 上看到。单击 **保存规则**。