跟踪钻取入门
您可以使用跟踪来识别应用程序和服务中的错误,然后对其进行优化和精简。
处理跟踪时,请从全局视角开始。使用主要信号、RED 指标、过滤器以及结构或跟踪列表选项卡进行调查,以探索您的数据。要了解更多信息,请参阅概念。
注意
扩展您的可观测性旅程,了解钻取应用套件。
开始之前
要在 Grafana Cloud 中使用 Grafana 跟踪钻取,您需要
- 一个 Grafana Cloud 账户
- Grafana Cloud 中的一个 Grafana Stack,并配置了 Tempo 数据源
要在自行管理的 Grafana 中使用跟踪钻取,您需要
- 您自己的 Grafana v11.2 或更高版本实例,并配置了 Tempo 数据源
- 安装了跟踪钻取插件
有关更多详细信息,请参阅访问跟踪钻取。
探索您的跟踪数据
大多数调查遵循以下步骤
- 选择主要信号。
- 选择要使用的指标:速率、错误或持续时间。
- 定义过滤器以优化数据视图。
- 使用结构或跟踪列表深入研究问题。
示例:调查错误源
例如,您想找出 span 中的错误源。为此,您需要比较跟踪中的错误,以找到问题跟踪。具体操作如下。
选择数据级别和指标
为了识别问题点,您想使用原始跟踪数据,而不是仅仅使用根 span(它是每个跟踪的第一个 span)。在过滤器中选择所有 spans,然后选择错误指标。
关联属性
要将属性值与错误关联起来,请使用比较选项卡。此选项卡会显示与错误 span 密切相关的属性值。结果按属性差异从高到低排序。这有助于您立即看到导致错误的原因。您可以在这里看到,99.34% 的情况下,span 名称等于HTTP GET /api/datasources/proxy/uid/:uid/*
,并且该 span 也报告了错误。
检查问题
要深入挖掘,请选择检查以聚焦于问题。很容易发现问题:高高的红色条表示问题发生在HTTP GET /api/datasources/proxy/uid/:uid/*
。接下来,使用添加到过滤器来仅聚焦于报告错误的 API 调用。
使用根本原因错误
选择根本原因错误以查看所有包含错误的跟踪的聚合视图。要查看更多详细信息,请右键单击一行并选择HTTP 出站请求。
要检查单个示例事务,请单击一个条目,打开用于构建该聚合视图的某个单独跟踪。