Grafana Alloy 故障排除
有时很难确定 Grafana Alloy 是否以及向后端发送了什么。本文重点介绍了几种技术,以了解有多少追踪 Span 推送到 Alloy 以及它们是否到达后端。OpenTelemetry Collector 构成了追踪管线的基础,它在记录网络和其他问题方面做得非常出色。
如果您的日志没有显示明显的错误,以下建议可能会有所帮助。
指标
Alloy 发布了一些 Prometheus 指标,可用于确定它接收和成功转发了多少追踪流量。这些指标是诊断追踪 Alloy 问题的良好起点。
receiver_accepted_spans_ratio_total
receiver_refused_spans_ratio_total
exporter_sent_spans_ratio_total
exporter_send_failed_spans_ratio_total
Alloy 有一个 Prometheus 抓取端点 /metrics
,您可以通过在浏览器中打开 https://:12345/metrics
在本地检查指标。Alloy HTTP 服务器的 /metrics
HTTP 端点公开了 Alloy 组件和控制器指标。有关更多信息,请参阅 监控 Grafana Alloy 组件控制器 文档。
在 Grafana Cloud 中检查指标
在您的 Grafana Cloud 实例中,您可以使用 grafanacloud-usage
数据源检查指标。要查看指标,请按照以下步骤操作
- 在您的 Grafana 实例中,从左侧菜单中选择 探索。
- 将数据源更改为
grafanacloud-usage
。 - 在文本框中输入要验证的指标。如果您以
grafanacloud_traces_
开头,可以使用自动完成功能浏览可用指标列表。
有关追踪使用相关的指标列表,请参阅云追踪使用指标。
追踪 Span 日志记录
如果指标和日志看起来正常,但您仍然无法在 Grafana Cloud 中找到追踪,您可以配置 Alloy 将其接收到的所有追踪输出到 控制台。