在 Grafana Cloud 中监控 Kubernetes 集群基础设施
欢迎来到这个学习路径,它将向您展示如何监控您的 Kubernetes 集群基础设施。
Kubernetes Monitoring 为您的 Kubernetes Fleet 提供可观测性,在一个体验中提供一套完整的工具。您可以使用它来实现最佳资源利用,并及早排查和检测问题。
借助 Kubernetes Monitoring,您可以获得
- 一个用于全面监控和可见性的平台。当您分析 Kubernetes 基础设施的健康状况并进行故障排除时,您将始终在同一Kubernetes Monitoring 应用中。这使得分析和故障排除更高效、更有效,缩短了平均解决时间。
- 一个预配置、精选的体验,包括成本和能源监控、资源效率数据和建议、预配置告警、告警规则、记录规则以及机器学习预测。
以下是您将学习到的内容
完成本学习路径后,您将能够
- 理解可观测性的价值以及 Grafana Kubernetes Monitoring 的优势
- 选择您要监控的数据
- 使用 Helm chart 在集群上部署 Kubernetes Monitoring
- 学习如何导航和解读 Kubernetes Monitoring 仪表盘
故障排除
如果您遇到困难,我们随时为您提供支持!在适当的情况下,故障排除信息只需点击即可获得。
更多探索
我们理解您可能希望探索并非严格遵循此路径的其他功能。在有意义的地方,我们将为您提供机会。
开始之前
开始此学习路径之前,请确保满足以下条件
- 您拥有 Grafana Cloud 账户。要创建账户,请参阅Grafana Cloud。
- 安装告警所需的 Admin 角色
- 您想要监控的 Kubernetes 集群、环境或舰队
kubectl
和Helm命令行工具
- 您知道要监控的 Kubernetes 集群和命名空间的名称。
- 如果您不知道 Kubernetes 集群名称,可以在终端中使用以下命令获取当前 Kubernetes 上下文的集群名称:
kubectl config view --minify -o jsonpath='{.clusters[].name}{"\n"}'
。
- 如果您不知道 Kubernetes 集群名称,可以在终端中使用以下命令获取当前 Kubernetes 上下文的集群名称:
- 您知道您的 Kubernetes 环境是如何部署的。Grafana Kubernetes Monitoring 支持以下 Kubernetes 部署类型
- Kubernetes,包括 Amazon Elastic Cloud Compute (EC2) 上的 Amazon Elastic Kubernetes Service (EKS) 和 Google Kubernetes Engine (GKE)
- AWS Fargate 上的 Amazon EKS。Node Exporter指标已禁用。而是使用 Kubernetes API 来收集 Pod 日志。
- Azure Kubernetes Service (AKS)
- Google Kubernetes Engine (GKE) Autopilot。此平台不支持 Node Exporter 指标。
- IBM Cloud Kubernetes Service
- Red Hat OpenShift
- 您有权限在您的 Kubernetes 集群中创建命名空间并部署 Helm chart。