关于 Linux 服务器集成预置仪表板
Linux 服务器集成提供了各种预置仪表板,您可以立即使用它们来开始故障排除。在本学习旅程的这一步中,您将熟悉这些预置仪表板,并学习如何使用它们来解决各种问题。
虽然本学习旅程仅侧重于在一台机器上配置 Linux 服务器集成,但以下仪表板图像展示了您在监控多台机器时将看到的数据类型。
您知道吗?
如果您没有看到任何日志或指标,请尝试使用仪表板顶部的下拉菜单切换数据源。
此仪表板提供系统的全面概览,包括
- 元数据:显示内核版本、操作系统发行版、正常运行时间等信息。
- CPU 使用率:显示当前 CPU 的使用情况。
- 内存使用率:显示正在使用的内存量。
- 磁盘使用率:指示磁盘空间的占用程度。
- 网络使用率:提供有关网络使用情况的信息。
使用此仪表板可以
- 对您的 Linux 系统的运行状态有一个高层次的了解。
此仪表板显示有关 CPU 和系统时钟的信息。
Linux 节点的 CPU 和系统时钟仪表板
使用此仪表板可以
- 检查 CPU 使用率问题。它允许您查看机器上的整体 CPU 使用情况,但无法识别导致高使用率的具体进程。
- 监控系统在三个时间间隔(1 分钟、5 分钟和 15 分钟)内的平均负载时间。此信息反映了对 CPU 的需求。
- 确认系统时钟与 NTP 服务器同步。
此仪表板显示有关文件系统和磁盘的信息,包括每个文件系统的可用空间、整体磁盘空间使用情况、随时间变化的读写活动以及平均等待时间。
使用此仪表板可以
- 监控磁盘容量并确定磁盘何时接近满负荷使用。
- 查找存在错误的文件系统。
- 检测系统上的输入/输出 (I/O) 负载何时过高,可能导致应用程序延迟。
此仪表板提供了整个集群的概览,包括以下信息
- 元数据,例如集成版本和数据检索状态
- 集群成员列表
- 集群的性能指标,包括 CPU、内存、磁盘使用情况和网络活动
使用此仪表板可以
- 快速了解环境概况
- 识别异常值或不寻常的活动,并调查特定节点以获取更多详细信息
此仪表板提供了整个集群的概览,包括以下信息
- 元数据,例如集成版本和数据检索状态
- 集群成员列表
- 集群的性能指标,包括 CPU、内存、磁盘使用情况和网络活动
使用此仪表板可以
- 快速了解环境概况
- 识别异常值或不寻常的活动,并调查特定节点以获取更多详细信息
此仪表板提供有关已用内存和可用内存的详细信息,包括
- 概览:显示当前已用总内存的百分比,包括实时和随时间变化的情况。
- 虚拟内存统计信息
- 页面进/出:指示内存何时移入 RAM 或移出到磁盘。
- 页面错误:显示进程尝试访问不可用内存(通常是因为它存储在磁盘上)的情况。虽然一些页面错误是正常的,但数量过多可能表明系统因高内存进程相互冲突而过载。
- 内存不足 (OOM) 杀手:列出系统内存耗尽时终止的进程,包括磁盘上的交换空间也耗尽的情况。任何 OOM 杀手事件都表明存在问题。
- 内存统计信息:提供进程的整体内存使用情况概览,以及内存如何分配和释放。
使用此仪表板可以
- 跟踪应用程序的内存使用情况,包括来自 OOM 杀手的洞察,这通常表明存在问题。
- 分析页面调度信息,这可以揭示系统是否因应用程序需求超过物理可用内存而过载。这种情况可能导致过度的磁盘访问,因为写入磁盘比写入 RAM 慢,可能降低应用程序性能并减缓操作。
此仪表板提供有关网络的洞察,包括
- 网络概览:显示连接到系统的网络设备的状态和使用情况,涵盖物理设备(如以太网和 Wi-Fi)和虚拟设备(如 Docker 网络、环回设备、网络桥接和 NAT 转换)。
- 网络套接字:提供已打开、已关闭和正在使用的网络连接摘要。这包括 TCP(通常用于较大且更可靠的数据传输,如 HTTP)和 UDP(通常用于可以处理偶尔丢包的实时数据传输,如音频和视频流)。
- 网络 netstat:概述正在传输和接收的数据包,包括错误率。高错误率可能表明系统或网络内部存在问题。
使用此仪表板可以
- 评估网络设备的功能状态。例如,如果您的以太网连接无法工作,则表明存在问题。
- 检测传输错误。例如,高 TCP 错误率表明网络中的某个地方可能存在故障。
在本学习旅程的这一点,您可以探索以下路径