菜单
开源

Grafana Alloy 故障排除

有时很难确定 Grafana Alloy 是否以及向后端发送了什么。本文重点介绍了几种技术,以了解有多少追踪 Span 推送到 Alloy 以及它们是否到达后端。OpenTelemetry Collector 构成了追踪管线的基础,它在记录网络和其他问题方面做得非常出色。

如果您的日志没有显示明显的错误,以下建议可能会有所帮助。

指标

Alloy 发布了一些 Prometheus 指标,可用于确定它接收和成功转发了多少追踪流量。这些指标是诊断追踪 Alloy 问题的良好起点。

otelcol.receiver.otlp 组件

receiver_accepted_spans_ratio_total
receiver_refused_spans_ratio_total

otelcol.exporter.otlp 组件

exporter_sent_spans_ratio_total
exporter_send_failed_spans_ratio_total

Alloy 有一个 Prometheus 抓取端点 /metrics,您可以通过在浏览器中打开 https://:12345/metrics 在本地检查指标。Alloy HTTP 服务器的 /metrics HTTP 端点公开了 Alloy 组件和控制器指标。有关更多信息,请参阅 监控 Grafana Alloy 组件控制器 文档。

在 Grafana Cloud 中检查指标

在您的 Grafana Cloud 实例中,您可以使用 grafanacloud-usage 数据源检查指标。要查看指标,请按照以下步骤操作

  1. 在您的 Grafana 实例中,从左侧菜单中选择 探索
  2. 将数据源更改为 grafanacloud-usage
  3. 在文本框中输入要验证的指标。如果您以 grafanacloud_traces_ 开头,可以使用自动完成功能浏览可用指标列表。

有关追踪使用相关的指标列表,请参阅云追踪使用指标

Use Explore to check the metrics for traces sent to Grafana Cloud

追踪 Span 日志记录

如果指标和日志看起来正常,但您仍然无法在 Grafana Cloud 中找到追踪,您可以配置 Alloy 将其接收到的所有追踪输出到 控制台