Grafana Labs
可观测性调查
2024
关于可观测性现状的主要发现和分析
引言
可观测性已成为许多组织构建和维护其系统中不可或缺的一部分,通过更好地利用资源,有助于提高性能、减少重复性劳动并节省资金。然而,这些结果并非总是能保证,许多团队仍然难以适应这个不断发展领域的复杂性。
为了更好地了解组织在可观测性发展历程中的位置,以及由此带来的成功和挑战,我们在第二届年度 Grafana Labs 可观测性调查中向社区征集了反馈。我们听取了 300 多位行业从业者的意见,他们分享了自己的经验,帮助我们生动地描绘了该行业的现状和发展方向。
在本报告中,您将看到调查结果的细分,这些结果表明市场正趋于成熟,团队正在应对数十种工具和数据源。您还将看到,开放标准已成为解决这种复杂性的手段,同时,团队也在不断寻求提高自动化和责任追究水平。
调查快照
最常用的可观测性技术
5 大关键要点
可观测性实践仍在走向成熟
工具和数据蔓延仍然是主要障碍
开源是事实上的标准
AI 最终可能会扮演重要角色
成本成为首要担忧
可观测性持续(不均衡)成熟
更多组织实现集中式可观测性
集中式可观测性节省时间和金钱
如果您的组织已实现集中式可观测性,这是否带来了时间/成本的节约?
按行业划分
帮助团队对可观测性数据进行插装和存储,意味着他们可以将更多时间花在核心任务上。
- 某欧洲大型科技公司受访者谈集中式可观测性的益处
很少有组织采用系统式方法
以下哪项最能描述您组织当前可观测性工作的成熟度?
反应式
在您知晓问题之前,客户已经将问题带给您。时间花在响应用户报告的问题上。
主动式
您努力制定流程并实施工具,以便在用户知晓问题之前了解问题。有时您能够阻止问题影响客户。
系统式
您制定流程并实施工具,以便在用户知晓问题之前了解问题,并且能够将对用户的影响降至最低。可观测性和性能测试在 SDLC 的早期阶段实施,从而防止问题在生产环境中发生。
责任追究仍有待提高
应用程序可观测性呈上升趋势
组织的可观测性策略越成熟,结果越好

真是。太多的。工具。
您的团队使用哪些可观测性技术*?
*受访者可以选择多种技术
团队依赖大量数据源……
您/您的团队在 Grafana 中配置并积极使用了多少个数据源?

……还有更多的工具
您正在使用多少种可观测性技术?

公司规模和行业有所差异
六个或更多数据源
六个或更多可观测性技术(团队)
六个或更多可观测性技术(公司)
我们实现了平均修复时间 (MTTR) 显著缩短 34%,增强了系统可靠性并简化了操作流程,从而使总体开销减少了 29%。
- 某亚洲小型软件公司受访者谈集中式可观测性的益处
数据关联具有多重益处
如果您以这种方式关联数据,您从中获得了什么价值*?
开源软件是可观测性的事实标准方法
前 10 位中的 8 位

最受欢迎的可观测性技术是开源的比例
您使用的可观测性工具是开源许可证还是商业许可证?
Prometheus 仍是可观测性的支柱
您在 Prometheus 上投入了多少?
您目前的 Prometheus 使用情况与一年前相比如何?
OpenTelemetry 正在兴起
您在 OpenTelemetry 上投入了多少?

您目前的 OpenTelemetry 使用情况与一年前相比如何?
Prometheus 和 OpenTelemetry 并非二选一
OpenTelemetry 与 Prometheus 的重叠使用情况
开放标准与多种工具并行不悖
未来:解决差距并推动创新
成本和复杂性仍然是巨大挑战
关于可观测性的最大担忧*

AI 有望成为可观测性自动化和辅助的福音
哪些 AI/ML 驱动的功能*对您的可观测性实践最有价值?
观察 AI 的早期阶段
开源软件、AI 和更广泛的采用令人兴奋
受访者最期待的可观测性主题
第四常被提及的答案 eBPF 是另一个值得关注的话题。虽然只有 7% 的受访者表示他们在生产环境中使用了这项内核级技术,但有 42% 的受访者表示他们正在讨论或构建概念验证 (POC)。
如果能找到让入门更容易的方法就太好了。有很多非常有趣的技术,但在理解可观测性的人和不理解的人之间仍然存在巨大的知识鸿沟。
- 某亚洲大型媒体娱乐公司受访者
关于受访者和方法
您的组织属于哪个行业?
您的组织规模*是?
您所在的地区是?

结论
Grafana Labs 谨代表我们向参与调查的受访者以及抽出时间查看结果的读者表示感谢。开源社区、我们的客户、贡献者和用户都是我们工作中不可或缺的一部分,您的反馈每天都在指导着我们的运营以及项目和产品的改进。
我们很高兴看到可观测性取得了长足的进步,以及各种规模、不同行业的组织如何在全球范围内将这些工具和技术付诸实践。
将此信息与去年的调查结果进行比较
2023 年可观测性调查结果