Kushki 如何使用 Grafana Cloud 集中可观测性数据并获得更好的业务洞察

高层摘要

作为拉丁美洲领先的数字支付提供商,Kushki 负责为该地区 200 多家客户确保安全成功的电子交易。这家总部位于厄瓜多尔的公司 100% 无服务器化,使用 AWS Lambda 和 DynamoDB,他们还使用 AWS Route53 处理 API 用户请求,AWS X-Ray 进行追踪,CloudWatch 处理日志文件。为了将所有这些信号汇总起来,Kushki 迁移到 Grafana Cloud,以集中查看他们的基础设施以及整体业务情况。

为何选择 Grafana Cloud?

Kushki 能够利用 Grafana Labs 的全托管、开放且可组合的可观测性 Stack,统一所有数据源并在一个全面的监控解决方案中可视化他们的遥测数据。

集中式可观测性 Stack

借助 Grafana Cloud 庞大的 100+ 数据源插件网络,Kushki 工程师能够将来自 MongoDB、Prometheus、AWS XRay 和 CloudWatch 的数据整合关联,通过托管的 Grafana 在单一窗口中展示。通过在 Grafana 仪表盘中汇集分散的指标和日志数据源,该团队能够扩展其整体可观测性策略的广度。Kushki 云基础设施经理 Giacomo Orizzonte 表示:“我们的监控和可观测性不再仅仅关乎服务器、API 或 AWS 中的资源使用。现在,它关乎我们如何在业务层面采纳 Grafana Cloud 提供的工具,并利用它们来审视我们在平台上的客户成功情况。”

轻松上手

当团队通过 AWS Marketplace 购买 Grafana Cloud 时,他们不仅节省了时间,将采购流程从数月缩短到几天。他们还能够即时配置和实施可视化工具。Kushki IT 架构经理 Javier Valencia 表示:“学习曲线非常快。从一个工具迁移到另一个工具对任何人来说都可能很痛苦,但我们的团队发现学习使用 Grafana 一点都不痛苦。”

双赢合作

在决定从现有监控平台迁移到 Grafana Cloud 时,一个重要的迁移原因就是 Grafana Labs 团队。Javier Valencia 说:“选择 Grafana Cloud,我们就拥有了一家在整个过程中都提供了帮助的供应商,这对他们和我们公司来说是双赢的。”“Grafana 也诚实地介绍了他们的开发流程。功能路线图的清晰度对我们来说非常重要。”

一个平台,多重益处

Kushki 最初寻找新的可观测性工具时,目标是汇集所有数据以更高效地监控其基础设施。通过 Grafana Cloud,他们获得了远超预期的解决方案。统一数据带来的洞察为公司带来了附加价值,它不仅识别了改进领域以提升应用程序性能,还为高层管理人员提供了关键业务指标(例如交易成功率)的更深入分析。

Kushki’s Transactional Processor dashboard

挑战

云基础设施和架构团队最初使用各种不同的工具来端到端地跟踪所有客户的交易。然而,随着公司规模的快速扩张,在确定出现问题的根本原因时,协调不同平台变得越来越困难。Javier Valencia 说:“我们有一个工具来查看技术问题,另一个工具来查看业务问题,这些工具与我们的可视化工具是分开的。所以我们的主要目标是找到一个能够全面了解我们系统的单一工具。我们还希望更好地理解交易失败的真正原因——是技术原因?业务原因?还是开发团队的更改?”

解决方案

Grafana Cloud 可以找到所有这些问题的答案,它允许您访问和统一所有 AWS 产品中的数据,例如 Amazon CloudWatch、Amazon Athena、Amazon OpenSearch Service、Amazon Redshift、Amazon Timestream 和 AWS X-Ray,以及 Elasticsearch、Graphite、InfluxDB 等第三方工具。他们还利用 Grafana Alerting 聚合不同的数据集来配置多维度警报。Giacomo Orizzonte 表示:“这是一个新功能,对我们帮助很大。”

结果

现在,当他们分析任何给定交易的成功率时,团队可以在一个 Grafana 仪表盘中立即访问有关响应时间、API 或 Rails 应用程序的数据。但这仅仅是开始。他们不仅能更清晰地看到数据,还能主动响应洞察。Giacomo Orizzonte 说:“监控的补充是,我们现在可以在一个地方可视化理解交易流程。”“通过这些可视化图表,我们能够了解可以在我们这边改变什么——调用、库、组件的某些部分——以便优化我们的响应时间。通过在 Grafana 中关联日志和 AWS X-Ray 数据,我们已经能够将 API 的响应时间缩短三秒。”他们预计未来还会看到更多益处。Giacomo Orizzonte 说:“我们正在更多地探索 Grafana Machine Learning,并期待报警功能带来许多新特性。有了 Grafana,未来一片光明。”

Kushki logo
行业
金融服务
公司规模
500 多名员工
总部
厄瓜多尔基多