Grafana Cloud Asserts

上下文关联的自动化根本原因分析

Grafana Cloud Asserts 为您的遥测数据添加了一个上下文层,帮助您理解应用程序和服务的行为。当问题发生时,Asserts 利用 AI/ML 自动化关联相关问题的过程,使您能够快速发现根本原因。

Asserts 目前对 Grafana Cloud Advanced 客户开放。

faster troubleshooting icon

更快地排查问题

自动检测并关联全栈异常,以理解因果链。

Quickly identify problem domains icon

快速识别问题领域

通过单一视图轻松确定首先在哪里排查问题,该视图涵盖所有受影响的应用程序服务和底层基础设施。

reduce toil icon

减少 PromQL 使用,降低繁琐工作

访问由 Grafana Cloud 可观测性解决方案提供的领域特定 Dashboard 和遥测数据,无需编写 PromQL 查询即可进行全面的根本原因调查。

使用实体图查看所有相关数据

  • Asserts 分析来自 Prometheus exporter、服务网格(Istio, Linkerd)、基于 eBPF 的自动检测(Grafana Beyla)和 OpenTelemetry 的指标标签,以构建实体图。
  • 当事件被触发时,实体图用于整理所有相关组件,确保所有故障排除信号只需点击一下即可获得。
Relevant data

Architecture diagram of how Asserts works

开箱即用精选警报规则库

  • 利用标准化和基线化数据,Asserts 使用 SAAFE 模型 提供了一整套警报规则,涵盖了所有黄金信号。
  • Asserts 自动编写 PromQL,让您无需亲自动手。

使用 RCA Workbench 更快发现问题

  • 受事件影响的所有组件都在单一视图中自动关联。
  • 相关的指标、日志和追踪触手可及,便于进行根本原因分析。
  • 快速跳转到与事件组件和时间范围对应的日志和追踪。
RCA Workbench view in Asserts in Grafana Cloud

Asserts and Application Observability workflow in Grafana Cloud

利用精选的上下文关联 Dashboard 库节省时间

  • 访问预构建的技术特定 Dashboard,省去创建、维护和组织 Dashboard 的工作。
  • 通过统一的工作流程(连接 Asserts 和 Grafana Cloud 可观测性解决方案)进行深入调查。

Asserts 对所有 Grafana Cloud Advanced 客户开放

1

注册

2

激活

导航到 Grafana Cloud 菜单中的 Asserts 部分,并按照提供的说明进行操作。

3

发送所需指标以发挥最大价值

Asserts 在与基础设施指标、RED (速率、错误、持续时间) 指标和服务图指标一起使用时提供最佳体验。了解更多。

我们的系统将自动分析您的设置,如果需要额外帮助,可能会提示您提交支持工单。

4

可视化和发现

即时洞察您的系统在整个 Stack 中的行为。

“我们的 SRE 一直在寻求从现有指标、日志和追踪投资中获得更深入的洞察。Grafana Cloud Asserts 的核心是利用实体图和工作台等工具从这些信号中提取更多价值——这正是我们的 SRE 所要求的。Asserts 帮助我们将遥测数据付诸行动,并最终更快地解决问题。我们需要让更多的 SRE 使用它。”
Olin Gay
可观测性负责人,ObservabilityCON 2024 主题演讲