插件 〉合成监控


开发者
Grafana Labs

注册以接收偶尔的产品新闻和更新



应用程序
grafana

合成监控

  • 概述
  • 安装
  • 变更日志
  • 相关内容

合成监控应用程序

合成监控是一种黑盒监控解决方案,作为 Grafana Cloud 的一部分提供。合成监控为用户提供了从外部角度了解其应用程序和服务行为的洞察力。用户可以定义检查,以从世界各地的一个或多个探测位置持续测试远程目标,以评估服务的可用性、性能和正确性。每次检查运行时,都会收集指标和日志并发布到用户的 Grafana Cloud 服务。指标发布到 Grafana Cloud Prometheus,日志发布到 Grafana Cloud Loki。

合成监控是原始 worldping 应用程序 的继任者。更新后的合成监控产品侧重于降低复杂性并利用 Grafana Cloud 的功能。

检查类型

用户可以定义 HTTP/HTTPS、DNS、TCP 和 ICMP Ping 检查以监控其远程目标。在内部,合成监控解决方案使用 Prometheus Blackbox 导出器 来执行检查并收集指标和日志。在创建检查时,用户可以自定义 Blackbox 导出器支持的设置和验证规则。

探测位置

对于每个检查,用户可以选择一个或多个分布在世界各地的“公共”探测位置来运行测试。此外,用户可以通过下载和部署 合成监控代理 来运行自己的“私有”探测位置。

配置

合成监控需要一个 Grafana Cloud 帐户,并在 Grafana Cloud 堆栈中默认安装。本地 Grafana 实例可以通过 配置文件 配置为连接到合成监控。

apiVersion: 1

apps:

  • type: grafana-synthetic-monitoring-app name: grafana-synthetic-monitoring-app disabled: false jsonData: apiHost: <synthetic monitoring api url for your grafana cloud stack> stackId: <instance ID of your hosted grafana> logs: grafanaName: <name of an existing Loki datasource pointing to the Grafana Cloud Loki instance> hostedId: <Grafana Cloud Loki instance ID> metrics: grafanaName: <name of an existing Prometheus datasource pointing to the Grafana Cloud Prometheus instance> hostedId: <Grafana Cloud Prometheus instance ID> secureJsonData: publisherToken: <access policy token with read:stacks, write:metrics, write:logs, and write:traces scope>

配置详细信息

  • apiHost 预期合成监控 API URL,此处查看更多详细信息

  • stackId 需要一个整数,可以通过 gcom /instances/<orgSlug> 找到,或者访问 https://grafana.org.cn/orgs/<orgSlug>/stacks 并点击您要连接的堆栈的“详情”按钮。ID 将在 URL 中。

  • logsmetrics 部分指示插件需要使用哪些数据源。

    • grafanaName 需要与您在数据源配置中指定的名称完全匹配。
    • hostedId 需要一个整数,与您在数据源配置中的 basicAuthUser 相同。该值也可以从 loki 或 prometheus 的“详情”页面中找到,地址为 https://grafana.org.cn/orgs/<orgSlug>/stacks
  • publisherToken 是一个访问策略令牌,用于与您的云堆栈通信并发布探测器收集的遥测数据。访问策略需要具有以下范围

    • 读取堆栈
    • 写入指标
    • 写入日志
    • 写入跟踪

注意:您可以为每个 组织 添加一个配置块,为多个组织配置插件。您可以为每个组织块提供不同的值,并连接到每个组织的不同云堆栈。

先决条件

  1. 一个指向 Grafana Cloud 中托管的 Prometheus 实例的数据源
  2. 一个指向 Grafana Cloud 中托管的 Loki 实例的数据源

注意:Prometheus 和 Loki 实例必须是同一个云堆栈的一部分

所需的数据源可以通过 配置添加。所需的信息可以从云托管 Grafana 实例的数据源选项卡中找到的 Prometheus 和 Loki 数据源中复制。

apiVersion: 1

datasources:

  • name: <datasource name> type: loki access: proxy url: https://logs-prod-us-central1.grafana.net basicAuth: true basicAuthUser: <Grafana Cloud Loki instance ID> jsonData: maxLines: 1000 secureJsonData: basicAuthPassword: <viewer token from grafana.com> version: 1

  • name: <datasource name> type: prometheus access: proxy url: https://prometheus-us-central1.grafana.net/api/prom basicAuth: true basicAuthUser: <Grafana Cloud Prometheus instance ID> jsonData: timeInterval: 1s secureJsonData: basicAuthPassword: <viewer token from grafana.com> version: 1

运行本地环境

  1. 启动前端构建:yarn dev
  2. 启动 Grafana:yarn server
  3. Grafana 将在 localhost:3000 上可用

开始使用应用程序

  1. 通过侧边栏导航到合成监控
  2. 点击“开始使用”按钮。这将初始化应用程序。

在初始化过程中,合成监控后端将

  1. 验证配置⽂件中提供的发布者 API 密钥。
  2. 确保帐户具有活动的 Grafana Cloud Prometheus 和 Grafana Cloud Loki 服务
  3. 然后将与应用程序一起提供的仪表板导入。
  4. 最后,合成监控后端将收到服务已准备就绪的通知。

然后,用户可以创建检查以监控其远程目标。指标和日志将流入选定的云堆栈。

在 Grafana Cloud 上安装合成监控

有关更多信息,请访问有关 插件安装 的文档。

更改日志

1.15.2 (2024-9-19)

  • 允许在探测器创建中禁用浏览器检查(https://github.com/grafana/synthetic-monitoring-app/pull/928)
  • 添加浏览器检查验证(https://github.com/grafana/synthetic-monitoring-app/pull/930)
  • 新版本的浏览器仪表板(https://github.com/grafana/synthetic-monitoring-app/pull/931)
  • 在浏览器检查中添加私有预览徽章(https://github.com/grafana/synthetic-monitoring-app/pull/935)
  • 更新状态徽章的外观和组织(https://github.com/grafana/synthetic-monitoring-app/pull/936)
  • 将 k6 类型版本升级到 0.53.0(https://github.com/grafana/synthetic-monitoring-app/pull/937)
  • 将浏览器检查的最小频率设置为 60 秒(https://github.com/grafana/synthetic-monitoring-app/pull/938)
  • 添加特定于浏览器检查的脚本示例(https://github.com/grafana/synthetic-monitoring-app/pull/939)

1.15.1 (2024-8-26)

  • 将 axios 从 1.6.7 升级到 1.7.4(https://github.com/grafana/synthetic-monitoring-app/pull/909)
  • 恢复我们执行数据源查找的方式(https://github.com/grafana/synthetic-monitoring-app/pull/911)
  • 修复警报错误消息中的错别字(https://github.com/grafana/synthetic-monitoring-app/pull/913)
  • 通过其类型而不是名称获取 SM 数据源,以防止在数据源被重命名时出现错误(https://github.com/grafana/synthetic-monitoring-app/pull/921)
  • 恢复从组织角色而不是数据源获取 sm:write 权限(https://github.com/grafana/synthetic-monitoring-app/pull/923)
  • 添加新版本的正常运行时间计算查询,并在 FF 下设置它(https://github.com/grafana/synthetic-monitoring-app/pull/840/)
  • 当功能标志关闭时,隐藏检查卡中的 grpc 选项(https://github.com/grafana/synthetic-monitoring-app/pull/922)

1.14.13 (2024-8-20)

  • 在插件中添加了数据源 RBAC 支持。插件现在会尊重其数据源的 RBAC 权限。
  • 修复了使用空 TLS 配置保存现有检查的错误
  • 修复了 HTTP 检查遵循重定向复选框丢失的回归问题
  • 阻止将有问题的字符(逗号和单引号/双引号)添加到作业名称中
  • 修复了断言图表成功/失败率在脚本检查仪表板中执行错误查询的错误

1.14.11 (2024-7-25)

  • 检查创建页面已重新设计,变得更加人性化和直观。现在每个检查都有五个部分,无论其类型如何。
  • 检查类型现在在插件 UI 中有一个父组:API 端点、多步和脚本。
  • 在用户具有查看者角色时添加了限制。

1.14.10 (2024-7-10)

  • 将场景升级到 5.1.0 版本
  • 修复了没有链接的卡片上的光标类型
  • 改进未初始化的页面,以提供特定于部分的内容
  • 强制命名导出
  • 避免检查仪表板上的水平滚动
  • 添加经度验证修复的回归测试
  • 将数据源添加到包含项中,以便从 CDN 加载合成监控应用程序资产
  • 使 loki 查询获取范围而不是即时日志,以防止在临时测试中出现超时错误。

1.14.9 (2024-6-25)

  • 修复了在应用错误百分比、延迟和错误率面板的过滤器时出现的首页仪表板问题。
  • 修复了自定义探测器创建表单中经度字段的验证问题。

1.14.8 (2024-6-19)

  • 将 Grafana 依赖项(@grafana/ui、@grafana/data、@grafana/runtime 和 @grafana/schema)更新到 11.0.0 版本
  • 更新插件配置中的 Grafana 依赖项版本。
  • 添加了 PasswordField 组件,以在 HTTP 身份验证部分中掩盖密码输入。
  • 在检查的自定义标签部分添加了指向文档的链接。

1.14.7 (2024-6-11)

  • 在检查列表页面添加了测试执行率。添加了相应的排序选项,以便按升序/降序执行率对检查进行排序
  • 修复了场景首页仪表板中向下钻取不起作用的问题
  • 将 HTTP 身份验证类型更改为单选按钮模式,而不是多个复选框
  • 将探测器表单验证更改为 zod 架构

1.14.6 (2024-6-5)

  • 从多 HTTP 检查中删除了公共预览消息
  • 在管理检查列表状态中添加了 URL 参数,允许深度链接到特定检查
  • 修复了首页摘要表中作业重复的问题
  • 修复了场景仪表板中 SSL 工具提示的文本
  • 修复了检查创建表单中标签和标题的对齐问题
  • 修复了私有探测器的 Terraform 导出问题
  • 修复了执行计算器中测试执行的措辞
  • 将检查表单验证更改为 zod 架构

1.14.5 (2024-5-23)

  • 修复了 SSL 失败检查选项未在 HTTP 检查中生效的错误

1.14.4 (2024-5-2)

  • 修复了 traceroute 超时获取错误默认值的错误

1.14.3 (2024-5-1)

  • 修复了频率为 1 小时的检查在检查仪表板上显示不正确的正常运行时间的错误
  • 修复了配置页面中 Terraform 导出缺少所需依赖项的错误

1.14.2 (2024-4-30)

  • 使检查创建表单响应式

1.14.1 (2024-4-29)

  • 临时禁用导致脚本检查编辑器出现问题的响应式表单布局

1.14.0 (2024-4-29)

  • 添加基于 k6 的脚本检查类型
  • 更新检查创建表单的设计
  • 更新文档链接
  • 仅为 HTTP 检查类型显示查询参数
  • 修复错误日志切换以按探测成功而不是日志错误级别进行查询

1.13.4 (2024-4-18)

  • 允许按租户配置标签限制
  • 修复了检查测试在配置的超时时间之前可能超时的错误
  • 使用 HTTP 请求持续时间的平均值作为脚本检查延迟

1.13.3 (2024-4-11)

  • 修复了仪表板查询中的最小步长不必要地默认为 5 分钟的错误

1.13.2 (2024-4-10)

  • 修复了即使为空也始终提交基本身份验证的错误
  • 修复了脚本检查表单中的一些错别字
  • 清理了一些不再使用的旧功能标志

1.13.1 (2024-4-2)

  • 修复了空搜索状态和批量选择的问题
  • 修复了检查编辑表单中 TCP IP 版本选择部分的问题

1.13.0 (2024-3-27)

  • 将频率时间范围延长至最长 1 小时

1.12.10 (2024-3-27)

  • 修复了检查列表中正常运行时间和可达性颠倒的错误
  • 将旧的场景链接重定向到更新的模型

1.12.9 (2024-3-21)

  • 修复了批量取消选择检查的错误
  • 修复了阻止查询长时间段的错误

1.12.8 (2024-3-13)

  • 更新仪表板以指示它们已弃用。更新的版本在应用程序本身中可用。
  • 修复当用户没有检查时创建检查的断开的链接
  • 在脚本检查 UI 中添加脚本示例

1.12.7 (2024-3-11)

  • 更新仪表板以使用时间序列而不是已弃用的图表面板
  • 修复针对查看者可见的不可用的“添加检查”按钮。
  • 移除已弃用的 arrayVector
  • 添加探测区域选择

1.12.6 (2024-2-26)

  • 在仪表板中添加警报注释
  • 允许 HTTP 检查中使用无限制的头部
  • 改进检查创建后的导航
  • 更改导航模型,使用单个检查而不是仪表板下拉菜单

1.12.5 (2024-1-25)

  • 彻底改造 MultiHTTP 仪表板
  • 在仪表板菜单中添加“复制 JSON”按钮,以便用户可以将图表添加到自己的仪表板中

1.12.4 (2023-11-09)

  • 提高检查可视化视图中的最大数据点数量
  • 修复当实例没有警报规则数据源时的错误

1.12.3 (2023-11-07)

  • 重构摘要仪表板,提供更实用的检查概述
  • 修复 MultiHTTP 场景中选择单个 URL 时的错误
  • 为可达性和正常运行时间添加改进的描述工具提示
  • 通过滚动到第一个错误并聚焦输入来改进 MultiHTTP 表单中的错误处理
  • 更改默认的 MultiHTTP 超时时间
  • 为断言输入添加额外的上下文
  • 在生成的 Terraform 配置中包含 MultiHTTP
  • 修复当插件尚未初始化时导致闪烁的路由错误

1.12.2 (2023-10-16)

  • 更新有关 publisherToken 配置的文档
  • 在选择检查过滤器后持久化它们,并修复一些布局问题
  • 修复 MultiHTTP 检查中的一些布局问题
  • 在 MultiHTTP 检查中添加检查测试

1.12.1 (2023-9-21)

  • 修复检查类型选择中的一些问题
  • 添加 MultiHTTP 使用情况计算器

1.12.0 (2023-9-20)

  • 允许所有用户查看警报,编辑者可以编辑警报
  • 修复测试检查模态中的间距问题
  • 更新导致 Grafana 在复制时崩溃的模板仪表板 JSON
  • 更新 MultiHTTP URL 验证
  • 移除一些旧的功能标志
  • 移除已弃用的检查列表可视化视图

1.11.7 (2023-9-1)

  • 在检查列表可视化视图中添加筛选和搜索
  • 在 MultiHTTP 表单中添加启用/禁用功能
  • 修复 MultiHTTP 中的查询参数字段
  • 移除世界地图面板依赖项

1.11.6 (2023-8-23)

  • 在可视化菜单中添加一个探索按钮
  • 使用 base64 对 MultiHTTP 请求主体进行编码/解码

1.11.5 (2023-8-14)

  • 在 MultiHTTP 中添加警报级别
  • 修复错误率地图未按探测器筛选的问题
  • 使检查编辑器后退按钮不那么令人困惑
  • 移除已弃用的 ArrayVector
  • 修复一些 URL 验证问题
  • 各种布局问题

1.11.4 (2023-7-19)

  • 修复跟踪路由节点图面板中的未处理错误
  • 对 MultiHTTP 场景和表单进行各种调整

1.11.3 (2023-7-10)

  • 修复 HTTP 场景中的不正确频率值
  • 在所有场景中添加“编辑检查”按钮

1.11.2 (2023-26-1)

  • 修复从摘要页面到仪表板的断开的链接
  • 修复摘要页面上重复的“仪表板”

1.11.1 (2023-26-1)

  • 在功能标志后面添加一个 multihttp 场景

1.11.0 (2023-6-1)

  • 包括一些场景修复
  • 修复当实例重命名时识别数据源的一些问题
  • 用场景替换可视化列表视图
  • 移除旧的主题

1.10.1 (2023-4-26)

  • 抑制警报视图中错误的错误提示
  • 为 Terraform 生成输出添加一些测试

1.10.0 (2023-4-21)

  • 在功能标志后面添加和发布多 HTTP 功能
  • 在功能标志后面添加和发布基于场景的仪表板
  • 修复 TCP 查询/响应中 base64 编码的错误
  • 更新数据源查询编辑器,在跟踪路由查询中包含探测器

1.9.36 (2023-3-15)

  • 将构建工具从 grafana-toolkit 更新到 create-plugin

1.9.35 (2023-2-16)

  • 修复在跟踪路由检查中为节点面板渲染数据的错误

1.9.34 (2023-2-09)

  • 修复云实例中配置页面未渲染的错误

1.9.33 (2023-2-07)

  • 升级世界地图面板依赖项

1.9.32 (2023-2-06)

  • 修复云实例中配置页面未渲染的错误

1.9.31 (2023-1-13)

  • 修复在批量更新探测器后检查未重新获取的错误
  • 添加一些关于如何在创建令牌后设置私有探测的信息
  • 如果验证 HTTP HEAD 请求的主体,则显示错误状态
  • 移除旧的初始化流程

1.9.30 (2023-1-9)

  • 移除已弃用的初始化流程

1.9.29 (2023-1-4)

  • 在 HTTP 检查中添加代理头部

1.9.28 (2022-11-9)

  • 更新警报 URL 以与 Grafana 9 兼容

1.9.27 (2022-11-8)

  • 修复非跟踪路由超时字段上的错误消息

1.9.26 (2022-11-2)

  • 修复设置页面上的重复按钮

1.9.25 (2022-10-24)

  • 支持新的 Grafana 导航设置

1.9.24 (2022-10-11)

  • 修复导致仪表板重定向丢失查询参数的错误

1.9.23 (2022-10-5)

  • 将 Grafana 依赖项提升到版本 9

1.9.22 (2022-9-15)

  • 更新世界地图面板依赖项

1.9.21 (2022-8-10)

  • 更新到警报 UI 的链接

1.9.20 (2022-8-2)

  • 确保 100% 从不渲染为 100.0%

1.9.19 (2022-6-21)

  • 修复可能导致某些 promql 查询的值超过 100% 的错误

1.9.18 (2022-6-21)

  • 修复在 Grafana v9 中设置默认警报规则的错误

1.9.17 (2022-6-9)

  • 处理 Grafana v9 中警报 API 的重大更改

1.9.16 (2022-6-3)

  • 在探测器删除失败时添加更实用的错误消息

1.9.15 (2022-4-28)

  • 修复未配置的插件可能陷入无限循环的路由问题
  • 修复插件可能阻止导航到 Grafana 其他部分的路由问题

1.9.14 (2022-4-15)

  • 修复警报选项卡可能处于禁用状态但实际上不应禁用的错误

1.9.13 (2022-3-29)

错误修复

  • 修复可达性查询可能在较长时间窗口中超过 100% 的问题
  • 隐藏对没有更新仪表板权限的用户显示的仪表板更新模态

1.9.12 (2022-3-16)

错误修复

  • 仪表板地图未正确显示阈值
  • 在检查编辑器表单中显示自定义警报阈值

1.9.11 (2022-3-3)

错误修复

  • 修复断开的仪表板重定向逻辑

1.9.10 (2022-2-16)

错误修复

  • 在创建仪表板时使用数据源 UID 而不是名称
  • 修复在本地初始化时可能出现的潜在无限路由循环

1.9.9 (2022-2-04)

功能

  • 重新排列检查列表过滤器,位于一个中央下拉菜单下

1.9.8 (2022-2-01)

1.9.7 (2022-1-25)

功能

  • 在探测器编辑页面添加地图,以可视化经度和纬度

1.9.6 (2022-1-21)

功能

  • 将每个检查的标签最大数量增加到 10 个。

1.9.5 (2022-1-21)

错误修复

  • 修复阻止值在导航到编辑检查表单时显示的竞争条件

1.9.4 (2022-1-19)

错误修复

  • 更新路由以使用 React 路由器
  • 修复使用预测计算中的错误
  • 无障碍修复

功能

  • 在 Terraform 配置导出中包含跟踪路由检查

1.9.3 (2022-1-10)

错误修复

  • 优雅地处理无法连接到 API 的情况

1.9.2 (2022-1-06)

功能

  • 添加了对检查进行批量编辑探测器功能

1.8.1 (2022-1-04)

错误修复

  • 使用更多配置详细信息更新自述文件

1.8.0 (2022-1-04)

功能

  • 在 Terraform 配置下载中添加一个 terraform import 命令。这允许用户生成初始 TF 状态。

错误修复

  • 在所有仪表板中用 geomap 面板替换世界地图面板插件
  • 在摘要仪表板中使用更新的时间序列面板
  • 重命名 DNS 仪表板,使其与其他仪表板一致

1.7.0 (2021-12-01)

功能

  • 添加从插件配置页面导出检查和探测器为 Terraform 配置的功能
  • 在插件配置页面中添加一个按钮,用于生成新的 API 密钥

1.6.0 (2021-11-17)

功能

  • 添加跟踪路由检查类型

1.5.6 (2021-11-15)

错误修复

  • 在使用情况计算器中添加每分钟数据点

1.5.5 (2021-10-29)

功能

  • 在检查编辑器中将已弃用的探测器标记为已弃用。防止将已弃用的探测器添加到检查中。

1.5.3 (2021-09-20)

错误修复

  • 修复仪表板配置错误

1.5.2 (2021-09-20)

错误修复

1.5.1 (2021-09-14)

错误修复

1.5.0 (2021-09-13)

功能

1.4.0 (2021-09-08)

功能

  • 在功能标志后面添加 beta 功能跟踪路由 (#245) (89ab9b1)

1.3.2 (2021-09-08)

错误修复

  • 检查类型选择器在编辑时应禁用 (#360) (dda165e)

1.3.0 (2021-08-27)

错误修复

功能

  • 快到了...跳过文档发布步骤 (d97521c)
  • gcom 令牌密钥 (1c2b5b8)

[1.2.30] - 2021-08-27

  • 使用更新的构建过程开始新的变更日志