Grafana Cloud IRM

集成到您的 Grafana Cloud 堆栈中的事件响应与管理

Grafana IRM screenshot
Grafana Cloud IRM 集成了待命排班、警报路由和事件响应功能,可帮助您整合、定制和自动化事件响应与管理,从而缩短响应时间。

真正有用的 Grafana Cloud 免费计划

  • 50GB Traces
  • 1 万个 Metrics
  • 14 天保留
  • 3 个活跃用户
  • 50GB 遥测日志
Stopwatch icon

快速且自信地响应问题

定制工作流,以便您拥有解决问题和保障 24/7 覆盖所需的所有信息和正确的利益相关者。

Record icon

消除事件发生前、中、后的困惑

从 IRM 主页即可集中沟通、自动化手动任务,并获得完整的事件响应时间线。

Piggybank icon

只按活跃用户付费

只有当工程师真正使用 Grafana Cloud IRM 时,您的账单才会增加。

在正确的时间通知正确的人

改进沟通并定制警报通知,确保关键信息送达正确的团队成员。

  • 通过 Slack、Microsoft Teams、Telegram、短信、电话、电子邮件等方式发送定制通知。
  • 接收根据您的角色和职责个性化定制的推送通知。
  • 使用自动化功能,通过模板和多级升级链消除障碍并缩短响应时间。
  • 从您偏好的沟通渠道确认、解决或升级事件。
Grafana IRM personalized notifications UI

按您的方式待命

使用由了解待命班次压力的工程师为分布式团队构建的工具,确保全天候事件响应。

  • 直接在 IRM 中管理待命排班,提供 Terraform 和 iCal 导入等灵活选项。
  • 通过计划性覆盖让工程师掌控他们的待命排班,利用 Google 日历集成自动化请假换班请求,并轻松考虑时区、排班轮换等因素。
  • 通过浏览器或移动应用随时随地轻松查看轮换详情、即将到来的班次和换班请求。
Grafana OnCall schedule

现在和未来做出数据驱动的决策

对于每个事件,使用单一可信来源,它提供完整的事件摘要,帮助您做出明智选择。

  • 获取全面的时间线,追踪事件生命周期中的关键行动、决策和更新。
  • 自动将时间线转换为结构化的事件后回顾文档,并维护每个事件的集中、权威记录。
  • 通过识别和分析瓶颈及改进领域,从过去的事件中学习。
Grafana Incident Insights screenshot

使用机器学习检测异常

使用我们的诊断助手 Sift,您可以运行自动系统检查,快速有效地发现问题,从而更快地解决问题。

  • 获得系统健康的整体视图,以便在异常和复杂问题升级为重大事件之前自动识别它们。
  • 利用自动 Sift 检查,更快地启动事件响应。
  • 根据反馈和结果,随着时间推移开发个性化响应。
Grafana Incident UI showing error pattern logs

在您的可观测性堆栈内运行事件响应

当出现令人担忧的问题时,立即在您的 Grafana Cloud 可观测性堆栈中从被动事件响应转变为主动事件响应。

  • 当您发现异常或令人担忧的趋势时,可以直接从任何 Grafana 可视化发起事件。
  • 收集事件频率和类型的数据,以优化您的可观测性和响应策略。
  • 与您偏好的 ITSM 工具集成,以定制您的事件响应和管理工作流,包括 Jira、ServiceNow、Github 等。
Declare incident menu

随时随地进行事件响应与管理

使用 IRM 移动应用,您可以随时随地处理紧急情况。

个性化通知

  • 接收根据您的个人偏好量身定制的推送通知。
  • 对于紧急情况,覆盖“请勿打扰”设置。

待命排班触手可及

  • 随时随地查看待命轮换详情。
  • 快速查看即将到来的班次和团队可用性。
  • 轻松与团队请求换班。

按需查看事件详情

  • 直接通过您的移动设备确认、响应或升级事件。
  • 访问全面的事件信息,做出明智决策。
Grafana OnCall app alert groups

开始使用 Grafana Cloud 中的事件响应与管理

2

设置与您偏好应用的集成,例如 Slack,您可以在其中将 Grafana Incident 聊天机器人添加到相关频道。

3

配置通知

决定每个用户将如何接收通知并创建升级规则。

4

设置待命排班并开始声明事件

从 IRM 主页设置待命排班并管理警报组和事件。

有关完整的实施详情和最佳实践,
“经过三年多的历程,我们首先意识到无法检测到一些基本故障,然后引入 FCI,并接着添加了 Grafana Cloud IRM 和 Grafana SLO,现在我们在检测和修复面向客户的问题方面做得更好了。事实上,我们的检测时间减少了 80% 以上,这意味着我们的客户看到的错误更少,总体体验也更佳。”
Carlos Hernandez Saavedra
Cloud & SRE 主管

在 Grafana Cloud 中获取 IRM

检测、响应和学习。Grafana Cloud IRM 简化了事件工作流,帮助您专注于管理事件,而不是工具。

Cloud Free

永久免费。
最适合初期和小型团队,每月最多 3 个活跃 IRM 用户。
最简单的入门方式

Cloud Pro

按量付费
最适合需要扩展超过 3 个活跃 IRM 用户并解锁 8x5 支持的成长型团队。

Cloud Advanced

高级套餐
最适合希望扩展超过 3 个活跃 IRM 用户并解锁 24x7 支持的团队。

轻松连接到更多 Grafana Cloud 工具

Grafana Alerting

凭借强大灵活的规则和通知,统一管理整个堆栈的警报。

Grafana SLO

定义服务级别目标并创建错误预算警报,以便在客户发现问题之前捕获它们。

准备好开始了吗?