Grafana Kubernetes 监控的优势

Grafana Kubernetes 监控提供以下优势

将优先级问题置于首位

Kubernetes 概览页面提供 Kubernetes 对象计数、按集群划分的 CPU 和内存使用情况,以及容器和 Pod 的告警概览。您可以按集群和命名空间过滤此视图,然后找出需要关注的问题以开始解决。

Snapshot of counts, Cluster CPU and memory usage, deployed container images, and firing container alerts
对象计数、集群 CPU 和内存使用情况、已部署容器镜像和容器告警的快照

实时告警

实时告警一旦问题开始,实时告警会立即通知您。您可以从告警跳转到运行手册快速解决问题,创建自己的告警,或复制内置告警进行自定义。

日志与指标关联

虽然 Kubernetes 未提供原生的日志存储解决方案,但 Kubernetes Monitoring 使用 Grafana Loki 作为其日志聚合器。由于 Loki 和 Prometheus 共享标签,您无需配置和使用多种技术,即可关联指标和日志以更快地识别根本原因。

早期错误检测

您可以使用内置告警检测 CPU 限制等异常情况,了解哪些设置需要微调。网络带宽和饱和度按对象查看。Kubernetes Monitoring 中的时间范围选择器可查看对象的历史数据,揭示如峰值等模式。Pod 异常点检测可以发现 CPU 使用差异可能导致问题的 Pod。

成本可见性与管理

节点、负载均衡器和持久卷通常会产生独立的供应商费用,因此对其进行跟踪非常重要。自动扩缩架构使您能够实时适应不断变化的需求,但也可能导致成本迅速飙升。Kubernetes Monitoring 提供这些成本的可见性,以识别可降低成本的领域。通过成本预测,您可以查看潜在的未来成本。

资源效率管理

通过监控资源使用情况,您可以减轻基础设施不稳定的威胁,以

  • 确保分配了足够的资源,降低 Pod 驱逐的风险,并防止微服务和应用出现性能下降。
  • 消除未使用的或闲置的资源。

然后您可以进行调度调整,例如设置亲和性和反亲和性,以增强性能和可靠性。

资源使用预测

通过查看资源使用预测,您可以更好地预测项目或活动的资源需求。