分析跟踪数据
要进一步分析过滤后的 Span,请使用动态变化的选项卡:比较 (Comparison)、结构 (Structure)、根本原因分析 (Root cause analysis) 和 追踪列表 (Trace list)。
选择一个 RED 指标后,选项卡会随上下文变化而改变。
每个选项卡都提供了关于所提供信息的简要说明。
使用细分 (Breakdown) 选项卡
细分 (Breakdown) 选项卡根据所选资源或 Span 属性的值拆分所选指标。在使用持续时间 (Duration) 指标时,细分 (Breakdown) 显示所选属性每个值的第 90 个百分位持续时间,并按平均持续时间对属性序列进行排序。选择速率 (Rate) 时,细分 (Breakdown) 按每秒请求速率对属性序列进行排序,错误以红色显示。
您可以更改范围 (Scope) 以显示资源 (Resource) 或 Span。
使用按...分组 (Group by) 选择器,您可以按不同的属性对所选指标进行分组。例如,如果您选择了错误 (Errors) 作为指标类型,然后选择 service.name
属性,则显示的结果会显示按 service.name
排序的错误数量,匹配最多的排在前面。
应用默认使用 service.name
,并显示其他常用资源级别属性,例如 cluster
、environment
和 namespace
。在下拉列表中,您可以选择任何资源级别属性进行分组。
使用比较 (Comparison) 选项卡
比较 (Comparison) 选项卡可帮助您找出并排名与所选指标最相关的 Span 属性,以便您可以立即发现导致追踪级别问题的原因。
选择指标后,该选项卡会计算每个资源或 Span 属性在所选子集(选择 (selection))与所有其他 Span(基线 (baseline))之间值差异的强弱。它按差异的降序排列属性-值对,因此顶部条目是与您感兴趣的信号最独特相关的那些。
如果您正在查看错误 (Errors) 指标,选择 (selection) 包含所有错误的 Span,而基线 (baseline) 包含所有未出错的 Span。
如果您正在查看持续时间 (Duration) 指标,默认情况下,选择 (selection) 包含高于第 90 个百分位的最慢的 Span,而基线 (baseline) 包含所有其他 Span。您可以手动调整持续时间热图上的选择。
比较的行为也会因您选择的 RED 指标而异。例如,如果您正在查看错误 (Errors) 指标,比较会显示与错误相关的属性值。但是,如果您正在查看持续时间 (Duration) 指标,比较会显示与高延迟相关的属性。
使用“检查 (Inspect)”聚焦单个属性
检查 (Inspect) 使您能够细分并查看给定比较中的单个属性值。如果您有这样的比较,可以突出显示差异最大的值(此处 attribute=value
为 span.app.product.id=OLJCESPC7Z
),但您无法轻松查看所有其他值。
选择检查 (Inspect) 后,应用仅显示一个属性 span.app.product.id
,但显示每个值的可视化效果。
使用结构 (Structure) 选项卡
“结构 (Structure)”选项卡允许您从追踪中提取和查看聚合数据。选项卡的名称取决于您正在查看的指标
- 速率 (Rate) 提供服务结构 (Service structure)
- 错误 (Errors) 提供根本原因错误 (Root cause errors)
- 持续时间 (Duration) 指标提供根本原因延迟 (Root cause latency)
对于速率 (Rate),服务结构 (Service structure) 选项卡显示您的应用程序如何相互通信以处理请求。使用此选项卡分析符合当前过滤条件的追踪的服务结构。
对于错误 (Errors),根本原因错误 (Root cause errors) 选项卡显示在您选择的过滤条件下的错误结构。使用此选项卡可以立即查看导致追踪中更高层级问题的错误链。
选择持续时间 (Duration) 指标时,根本原因延迟 (Root cause latency) 选项卡显示运行时间最长的 Span 的结构,以便您可以分析慢速 Span 的结构。
图示的 Span 是使用来自多个追踪的 Span 编译而成的聚合视图。
使用追踪列表 (Trace list) 选项卡
每个 RED 指标都有一个追踪列表
- 速率 (Rate) 提供一个列出追踪 (Traces) 的选项卡。
- 错误 (Errors) 提供一个出错的追踪 (Errored traces) 列表。
- 持续时间 (Duration)(Span)列出慢速追踪 (Slow traces)。
在此视图中,您可以使用添加额外列 (Add extra columns) 将其他属性添加到新列。
更改所选时间范围
使用右上角的时间选择器修改追踪 Drilldown 中显示的数据。
您可以选择持续时间最长为 24 小时的时间范围。此时间范围可以是您配置的追踪数据保留期内的任何 24 小时时段。默认值为 30 天。
有关时间范围选择器的更多信息,请参阅使用面板 (Use dashboards)。