Grafana Labs
可观测性调查
2024
可观测性现状的关键发现与分析
引言
可观测性已成为许多组织构建和维护其系统的组成部分,通过更好地利用资源帮助提高性能、减少繁重工作并节省资金。然而,这些结果并非一定能实现,许多团队仍在努力适应这个不断演进领域的复杂性。
为了更好地了解各组织在可观测性发展历程中所处的阶段——以及由此带来的成功与失败——我们向社区征集了第二届年度 Grafana Labs 可观测性调查的反馈。我们收到了 300 多位行业从业者的经验分享,这为我们提供了关于行业现状及未来走向的引人入胜的快照。
本报告将对调查结果进行细致分析,这些结果表明市场正在走向成熟,团队同时应对着数十种工具和数据源。您还将看到,开放标准已成为解决这一复杂性的手段,与此同时,团队继续推动更高程度的自动化和责任制。
调查快照
最常用的可观测性技术
5 大主要发现
可观测性实践仍在走向成熟
工具和数据蔓延仍然是主要障碍
开源是事实上的标准
AI 最终可能发挥重要作用
成本成为最受关注的问题
可观测性持续(不均衡地)走向成熟
更多组织已集中可观测性
集中可观测性节省时间和金钱
如果您的组织已集中可观测性,这是否带来了时间/成本的节省?
按行业划分
帮助团队进行可观测性数据插桩和存储意味着他们可以花更多时间专注于核心任务。
- 一家大型欧洲科技公司的受访者谈论集中可观测性的益处
很少有组织采用系统式方法
哪一项最能描述您的组织当前可观测性工作的成熟度?
反应式
在您发现问题之前,客户已经向您反馈了问题。时间用于响应用户报告的问题。
主动式
您致力于开发流程并实施工具,以便在用户之前了解问题。您有时能够防止问题影响客户。
系统式
您开发流程并实施工具,以便在用户之前了解问题,并能够最大限度地减少对用户的影响。可观测性和性能测试在 SDLC 早期实施,防止问题出现在生产环境中。
责任制仍有待提高
应用可观测性正在兴起
组织的可观测性策略越成熟,结果越好

如此之多的工具。
您的团队使用哪些可观测性技术*?
*受访者可选择多种技术
团队依赖大量数据源……
您/您的团队在 Grafana 中配置并实际使用了多少数据源?

……以及更多工具
您正在使用多少种可观测性技术?

公司规模和行业有所不同
六个或更多数据源
六种或更多可观测性技术(团队)
六种或更多可观测性技术(公司)
我们实现了平均修复时间 (MTTR) 显着减少 34%,增强了系统可靠性并优化了运营流程,从而使总体开销降低了 29%。
- 一家亚洲小型软件公司的受访者谈论集中可观测性的益处
关联数据具有多重益处
如果您以这种方式关联数据,您从中获得了哪些价值*?
OSS 是可观测性的事实方法
前 10 名中的 8 个

最流行的可观测性技术是开源的
您是使用开源许可还是商业许可的可观测性工具?
Prometheus 仍然是可观测性的中坚力量
您在 Prometheus 上投入了多少?
您当前的 Prometheus 使用情况与一年前相比如何?
OpenTelemetry 正在兴起
您在 OpenTelemetry 上投入了多少?

您当前的 OpenTelemetry 使用情况与一年前相比如何?
Prometheus 和 OpenTelemetry 并非二选一
OpenTelemetry 与 Prometheus 的重叠情况
开放标准与多种工具并行不悖
未来展望:弥补差距,推动创新
成本和复杂性仍然是主要问题
关于可观测性的最大担忧*

AI 可能对可观测性自动化和辅助带来福音
哪些 AI/ML 增强功能*对您的可观测性实践最有价值?
观察 AI 尚处于早期阶段
对 OSS、AI 和更广泛的采纳充满期待
受访者最期待的可观测性话题
第四个最常被提及的答案 eBPF 是另一个未来值得关注的话题。虽然只有 7% 的受访者表示他们在生产环境中使用这项内核级技术,但 42% 的受访者表示正在讨论或构建 POC。
如果能找到更简便的入门方法就太好了。有很多非常有趣的技术,但在理解可观测性的人和不理解的人之间仍然存在知识障碍。
- 一家亚洲大型媒体娱乐公司的受访者
关于受访者和方法
您的组织属于哪个行业?
您的组织规模*是多少?
您所在的地区是?

结论
Grafana Labs 谨代表公司感谢所有参与本次调查的受访者以及花时间查看结果的读者。开源社区、我们的客户、贡献者以及用户都是我们在此所做一切的不可或缺的一部分,您的意见每天都在影响我们如何运营和改进我们的项目及产品。
我们很高兴看到可观测性发展到了怎样的程度,以及各组织在全球各地、不同行业和各种规模的组织中实践这些工具和技术的方式。
将此信息与去年的调查结果进行比较
2023 年可观测性调查结果