概念
分布式追踪通过跨服务跟踪请求来提供一种监控应用程序的方式。追踪记录请求的详细信息,以帮助理解问题发生或发生的原因。
追踪最适用于分析系统性能、识别瓶颈、监控延迟以及提供请求处理方式的完整视图。
要使用 Grafana Traces Drilldown 应用,您应了解以下概念
速率、错误和持续时间指标
Traces Drilldown 应用让您可以探索 Tempo 根据您的追踪生成的速率、错误和持续时间 (RED) 指标。
有助于调查 | 指标 | 含义 |
---|---|---|
活动异常峰值 | 速率 | 每秒请求数 |
追踪生态系统中的总体问题 | 错误 | 发生故障的请求数量 |
响应时间和延迟问题 | 持续时间 | 这些请求所花费的时间量,以直方图表示 |
有关 RED 方法的更多信息,请参阅 RED 方法:如何为您的服务插桩。
追踪和 Span
追踪表示请求或操作在分布式系统所有节点(尤其是容器化应用或微服务架构)中传递的过程。这使其成为发现瓶颈和互连问题的理想可观测性信号。
追踪由一个或多个 Span 组成。Span 是追踪中的工作单元,它具有相对于追踪开始时间的开始时间、持续时间以及工作单元的操作名称。它通常引用追踪中的父 Span,除非它是第一个 Span(也称为根 Span)。它通常包含与 Span 本身相关的键/值属性,例如请求中使用的 HTTP 方法,以及服务名称、子 Span 事件或指向其他 Span 的链接等其他元数据。
有关更多信息,请参阅 Tempo 文档中的 使用追踪查找解决方案。