Kushki 如何使用 Grafana Cloud 集中可观测性数据并获得更佳业务洞察

执行摘要

作为拉丁美洲领先的数字支付提供商,Kushki 负责为该地区 200 多家客户确保安全成功的电子交易。这家总部位于厄瓜多尔的公司 100% 采用无服务器架构,使用 AWS Lambda 和 DynamoDB,还使用 AWS Route53 处理 API 用户请求,AWS X-Ray 进行追踪,CloudWatch 处理日志文件。为了汇集所有这些信号,Kushki 迁移到了 Grafana Cloud,以集中管理其基础设施和整体业务的视图。

为何选择 Grafana Cloud?

Kushki 得益于 Grafana Labs 完全托管的开放式可组合可观测性技术栈,能够统一所有数据源,并在一个全面的监控解决方案中可视化其遥测数据。

集中的可观测性技术栈

借助 Grafana Cloud 庞大的 100 多个数据源插件网络,Kushki 的工程师能够将来自 MongoDB、Prometheus、AWS XRay 和 CloudWatch 的数据整合并关联到一个统一的 Grafana 托管视图中。通过将来自不同数据源的指标和日志汇集到 Grafana 仪表盘中,团队得以扩展其整体可观测性策略的广度。Kushki 的云基础设施经理 Giacomo Orizzonte 表示:“我们的监控和可观测性不再仅仅关注服务器、API 或 AWS 中的资源使用。现在,它更多地关注我们如何在业务层面采用 Grafana Cloud 提供的工具,并利用它们来查看客户在我们平台上的成功情况。”

轻松上手

当团队通过 AWS Marketplace 购买 Grafana Cloud 时,他们不仅节省了时间,还将采购流程从数月缩短至数天。他们还能够即时配置和实施这个可视化工具。Kushki 的 IT 架构经理 Javier Valencia 表示:“学习曲线很快。从一个工具迁移到另一个工具对任何人来说都可能很痛苦,但我们的团队发现学习使用 Grafana 一点也不痛苦。”

双赢合作关系

在决定将其现有监控平台迁移到 Grafana Cloud 时,一个主要原因是 Grafana Labs 团队。Javier Valencia 说:“使用 Grafana Cloud,我们得到了提供商在整个过程中提供的帮助,这对于他们和我们公司来说都是双赢的。Grafana 在其开发过程方面也很坦诚。产品路线图中功能清晰明了,这对我们非常重要。”

一个平台,多重益处

Kushki 最初寻找新的可观测性工具时,重点在于汇集所有数据,以便更高效地监控其基础设施。而 Grafana Cloud 提供的解决方案远不止于此。统一数据带来的洞察通过识别改进领域来提升应用性能,同时还为高层管理人员提供了对关键业务指标(例如交易成功率)更深入的分析,为公司带来了附加价值。

Kushki’s Transactional Processor dashboard

挑战

云基础设施和架构团队最初使用多种不同的工具来端到端地追踪所有客户的交易。然而,随着公司业务快速扩张,在确定出现问题的根本原因时,在不同平台之间切换变得越来越困难。Javier Valencia 说:“我们有一个工具查看技术问题,另一个工具查看业务问题,而这些工具与我们的可视化工具是分开的。因此,我们的主要目标是找到一个能够提供我们系统完整视图的单一工具。我们还想更好地理解交易失败背后的真正原因——是技术原因?业务原因?还是开发团队的变更?”

解决方案

所有上述问题的答案都可以在 Grafana Cloud 中找到,它允许您访问并 统一所有 AWS 服务中的数据,例如 Amazon CloudWatch、Amazon Athena、Amazon OpenSearch Service、Amazon Redshift、Amazon Timestream 和 AWS X-Ray,以及 Elasticsearch、Graphite、InfluxDB 等第三方工具。他们还在利用 Grafana 告警 功能聚合不同的数据集,以配置多维告警。Giacomo Orizzonte 说:“这是我们的一项新功能,非常有帮助。”

成果

现在,当他们分析任何特定交易的成功率时,团队可以在一个 Grafana 仪表盘中立即访问有关响应时间、API 或 Rails 应用的数据。但这仅仅是个开始。他们不仅可以更清晰地看到数据,还可以主动对洞察采取行动。Giacomo Orizzonte 说:“监控的补充功能在于,我们现在可以在一个地方直观地理解交易流程。通过这些可视化,我们能够了解需要在我们这边做出哪些改变——比如调用、库、组件的某些部分——以便优化我们的响应时间。通过在 Grafana 中关联日志和 AWS X-Ray 数据,我们已经成功将 API 的响应时间缩短了三秒。” 他们预计未来还会看到更多益处。Giacomo Orizzonte 说:“我们正在更多地探索 Grafana 机器学习,并且期待告警方面有很多新功能。Grafana 的未来一片光明。”

Kushki logo
行业
金融服务
公司规模
500+ 员工
总部
厄瓜多尔基多
使用的产品/项目