菜单

Traces Drilldown 入门

您可以使用跟踪来识别应用和服务中的错误,然后对其进行优化和精简。

使用跟踪时,请从宏观角度开始。使用主要信号、RED 指标、过滤器以及结构或跟踪列表选项卡来探索您的数据。要了解更多信息,请参阅 Concepts

注意

扩展您的可观测性之旅,了解Drilldown 应用套件

开始之前

要在 Grafana Cloud 中使用 Grafana Traces Drilldown,您需要

  • 一个 Grafana Cloud 账户
  • Grafana Cloud 中已配置 Tempo 数据源的 Grafana Stack

要在自助管理的 Grafana 中使用 Traces Drilldown,您需要

  • 您自己的 Grafana v11.2 或更高版本实例,并已配置 Tempo 数据源
  • 已安装 Traces Drilldown 插件

有关更多详细信息,请参阅 Access Traces Drilldown

探索您的跟踪数据

大多数调查遵循以下步骤

  1. 选择主要信号。
  2. 选择您想要使用的指标:速率、错误或持续时间。
  3. 定义过滤器以精细化您的数据视图。
  4. 使用结构或跟踪列表深入分析问题。
Give it a try using Grafana Play
使用 Grafana Play 试一试

使用 Grafana Play,您可以探索并了解其工作原理,通过实际示例学习,加速您的开发。您可以在 Grafana Play 站点上看到此功能。

示例:调查错误来源

例如,您想要找出 spans 中的错误来源。为此,您需要比较跟踪中的错误,以找到问题跟踪。其工作原理如下。

选择数据级别和指标

要识别问题所在,您需要使用原始跟踪数据,而不仅仅是根 span(每个跟踪的第一个 span)。在过滤器中选择 All spans,然后选择 Errors 指标。

Select All spans to view all raw span data and Errors as your metric

关联属性

要将属性值与错误关联起来,请使用 Comparison 选项卡。此选项卡会显示与错误 span 密切相关的属性值。结果按属性差异从高到低排序。这有助于您立即了解错误原因。您可以在这里看到,99.34% 的情况下,span 名称等于 HTTP GET /api/datasources/proxy/uid/:uid/* 且该 span 也报告了错误。

Errors are immediately visible by the large red bars

检查问题

要深入挖掘,选择 Inspect 以聚焦问题。很容易发现问题:高高的红色条表示问题出在 HTTP GET /api/datasources/proxy/uid/:uid/*。接下来,使用 Add to filters 仅关注该报错的 API 调用。

Add to filters to focus on the API call

使用根本原因错误

选择 Root cause errors 以查看所有包含错误的跟踪的聚合视图。要查看更多详细信息,右键点击一行并选择 HTTP Outgoing Request

Contextual menu available in the Root cause errors tab

要检查单个示例事务,点击一个条目以打开构成该聚合视图的单个跟踪之一。

Link to span data from Root cause errors