Grafana Cloud IRM

在 Grafana Cloud 中检测、响应和从您的事件中学习

Grafana 的事件响应与管理 (IRM) 工具简化了事件工作流程,可帮助您专注于管理事件,而不是您的工具。

我们的事件管理堆栈使您能够

  • 快速检测生产系统中的问题和更改
  • 轻松将警报升级到合适的团队
  • 自动声明、分配任务和为任何严重程度的事件进行沟通
  • 识别跨服务、团队或地理位置的事件的可行洞察

为什么要使用 Grafana Cloud 进行 IRM?

当出现问题时,Grafana 仪表盘通常是团队首先查找指标、日志和跟踪中答案的地方,也是他们最后查看以整理事后分析的地方。Grafana 自然处于事件响应管理的核心位置,借助 Grafana Cloud 上的 Grafana 警报、Grafana 事件和 Grafana 值班,我们使将 IRM 集成到您已知和喜爱的 Grafana 工作流程中变得更加容易。
Grafana 警报

在单个可搜索视图中管理和采取警报操作

单个 Grafana 警报页面将 Grafana 管理的警报和驻留在您的 Prometheus 兼容数据源中的警报整合到一个地方。无需查看多个页面来管理警报,您可以提高团队快速识别和解决问题的能力。

Grafana 事件

自动执行事件管理的常规任务

让事件工具通过与您喜欢的工具(如 GitHub、Slack 和 Google Suite)的集成,快速分配角色并记录从聊天操作/UI 中获得的经验教训。

Grafana 值班

创建和管理值班时间表

以开发人员为中心的工作流程使您能够轻松地创建和管理值班时间表,并使用直观的 API 自动执行升级。一切都是集成的,并且与现有的警报源和监控工具一起使用。

集成

在您的工具集中工作

Grafana 的 IRM 套件与您的工具无缝集成,用于任务管理、聊天操作、状态页面和警报。

使用 Grafana IRM 很容易入门

2

将工具集成到您喜欢的应用程序(如 Slack),您可以在其中将 Grafana 事件聊天机器人添加到相关频道。

3

配置通知

确定每个用户将如何接收通知并创建升级。

4

设置值班时间表并开始声明事件

在 UI 中建立值班时间表并声明您的第一个演练事件。

有关完整的实施详细信息和最佳实践,

Grafana Cloud 事件响应与管理 (IRM)

检测、响应和学习。Grafana 的事件响应与管理 (IRM) 工具简化了事件工作流程,可帮助您专注于管理事件,而不是您的工具。

云免费版

无需付费。永远。
最适合早期阶段和小型团队,每月最多有 3 个活动 IRM 用户。
最简单的入门方式

云专业版

按需付费
最适合需要扩展到 3 个以上活动 IRM 用户并解锁 8x5 支持的不断发展的团队。

云高级版

高级捆绑包
最适合希望扩展到 3 个以上活动 IRM 用户并解锁 24x7 支持的团队。

“我们没有计划进行更改,但当我们切换到 Grafana Cloud Logs 进行日志管理后,我们意识到 Grafana Cloud 的事件响应与管理套件自动提供给我们。当时,我们使用 PagerDuty 作为我们的升级工具,由于我们一直在寻找技术堆栈中所有可能的成本优化,因此 SRE 团队决定检查是否可以使用 Grafana IRM 替换它。剧透警报…… 它在易用性和成本方面一直是一个很好的替代方案。”
Alexander Koehler
高级 SRE

准备开始了吗?