快速且自信地响应问题
定制工作流,以便您拥有解决问题和保障 24/7 覆盖所需的所有信息和正确的利益相关者。
消除事件发生前、中、后的困惑
从 IRM 主页即可集中沟通、自动化手动任务,并获得完整的事件响应时间线。
只按活跃用户付费
只有当工程师真正使用 Grafana Cloud IRM 时,您的账单才会增加。
在正确的时间通知正确的人
改进沟通并定制警报通知,确保关键信息送达正确的团队成员。
- 通过 Slack、Microsoft Teams、Telegram、短信、电话、电子邮件等方式发送定制通知。
- 接收根据您的角色和职责个性化定制的推送通知。
- 使用自动化功能,通过模板和多级升级链消除障碍并缩短响应时间。
- 从您偏好的沟通渠道确认、解决或升级事件。
按您的方式待命
使用由了解待命班次压力的工程师为分布式团队构建的工具,确保全天候事件响应。
- 直接在 IRM 中管理待命排班,提供 Terraform 和 iCal 导入等灵活选项。
- 通过计划性覆盖让工程师掌控他们的待命排班,利用 Google 日历集成自动化请假换班请求,并轻松考虑时区、排班轮换等因素。
- 通过浏览器或移动应用随时随地轻松查看轮换详情、即将到来的班次和换班请求。
现在和未来做出数据驱动的决策
对于每个事件,使用单一可信来源,它提供完整的事件摘要,帮助您做出明智选择。
- 获取全面的时间线,追踪事件生命周期中的关键行动、决策和更新。
- 自动将时间线转换为结构化的事件后回顾文档,并维护每个事件的集中、权威记录。
- 通过识别和分析瓶颈及改进领域,从过去的事件中学习。
使用机器学习检测异常
使用我们的诊断助手 Sift,您可以运行自动系统检查,快速有效地发现问题,从而更快地解决问题。
- 获得系统健康的整体视图,以便在异常和复杂问题升级为重大事件之前自动识别它们。
- 利用自动 Sift 检查,更快地启动事件响应。
- 根据反馈和结果,随着时间推移开发个性化响应。
在您的可观测性堆栈内运行事件响应
当出现令人担忧的问题时,立即在您的 Grafana Cloud 可观测性堆栈中从被动事件响应转变为主动事件响应。
- 当您发现异常或令人担忧的趋势时,可以直接从任何 Grafana 可视化发起事件。
- 收集事件频率和类型的数据,以优化您的可观测性和响应策略。
- 与您偏好的 ITSM 工具集成,以定制您的事件响应和管理工作流,包括 Jira、ServiceNow、Github 等。
随时随地进行事件响应与管理
使用 IRM 移动应用,您可以随时随地处理紧急情况。
个性化通知
- 接收根据您的个人偏好量身定制的推送通知。
- 对于紧急情况,覆盖“请勿打扰”设置。
待命排班触手可及
- 随时随地查看待命轮换详情。
- 快速查看即将到来的班次和团队可用性。
- 轻松与团队请求换班。
按需查看事件详情
- 直接通过您的移动设备确认、响应或升级事件。
- 访问全面的事件信息,做出明智决策。
开始使用 Grafana Cloud 中的事件响应与管理
2
连接工具(推荐)
设置与您偏好应用的集成,例如 Slack,您可以在其中将 Grafana Incident 聊天机器人添加到相关频道。
3
配置通知
决定每个用户将如何接收通知并创建升级规则。
4
设置待命排班并开始声明事件
从 IRM 主页设置待命排班并管理警报组和事件。