Traces Drilldown 入门
您可以使用跟踪来识别应用和服务中的错误,然后对其进行优化和精简。
使用跟踪时,请从宏观角度开始。使用主要信号、RED 指标、过滤器以及结构或跟踪列表选项卡来探索您的数据。要了解更多信息,请参阅 Concepts。
注意
扩展您的可观测性之旅,了解Drilldown 应用套件。
开始之前
要在 Grafana Cloud 中使用 Grafana Traces Drilldown,您需要
- 一个 Grafana Cloud 账户
- Grafana Cloud 中已配置 Tempo 数据源的 Grafana Stack
要在自助管理的 Grafana 中使用 Traces Drilldown,您需要
- 您自己的 Grafana v11.2 或更高版本实例,并已配置 Tempo 数据源
- 已安装 Traces Drilldown 插件
有关更多详细信息,请参阅 Access Traces Drilldown。
探索您的跟踪数据
大多数调查遵循以下步骤
- 选择主要信号。
- 选择您想要使用的指标:速率、错误或持续时间。
- 定义过滤器以精细化您的数据视图。
- 使用结构或跟踪列表深入分析问题。
示例:调查错误来源
例如,您想要找出 spans 中的错误来源。为此,您需要比较跟踪中的错误,以找到问题跟踪。其工作原理如下。
选择数据级别和指标
要识别问题所在,您需要使用原始跟踪数据,而不仅仅是根 span(每个跟踪的第一个 span)。在过滤器中选择 All spans,然后选择 Errors 指标。
关联属性
要将属性值与错误关联起来,请使用 Comparison 选项卡。此选项卡会显示与错误 span 密切相关的属性值。结果按属性差异从高到低排序。这有助于您立即了解错误原因。您可以在这里看到,99.34% 的情况下,span 名称等于 HTTP GET /api/datasources/proxy/uid/:uid/*
且该 span 也报告了错误。
检查问题
要深入挖掘,选择 Inspect 以聚焦问题。很容易发现问题:高高的红色条表示问题出在 HTTP GET /api/datasources/proxy/uid/:uid/*
。接下来,使用 Add to filters 仅关注该报错的 API 调用。
使用根本原因错误
选择 Root cause errors 以查看所有包含错误的跟踪的聚合视图。要查看更多详细信息,右键点击一行并选择 HTTP Outgoing Request。
要检查单个示例事务,点击一个条目以打开构成该聚合视图的单个跟踪之一。