Kushki 如何使用 Grafana Cloud 集中其可观察性数据并获得更佳的业务洞察
执行摘要
作为拉丁美洲领先的数字支付提供商,Kushki 负责确保其 200 多个客户在该地区的电子交易安全和成功。这家总部位于厄瓜多尔的公司 100% 使用 AWS Lambda 和 DynamoDB,他们还使用 AWS Route53 处理 API 用户请求,使用 AWS X-Ray 进行追踪,使用 CloudWatch 记录日志文件。为了将所有这些信号整合在一起,Kushki 迁移到 Grafana Cloud,以便集中查看其基础设施和整体业务。
为什么选择 Grafana Cloud?
Kushki 能够利用 Grafana Labs 完全托管的开放且可组合的可观察性堆栈,统一其所有数据源并在一个全面的监控解决方案中可视化其遥测数据。
集中式可观察性堆栈
借助 Grafana Cloud 庞大的 100 多个数据源插件网络,Kushki 工程师能够将来自 MongoDB、Prometheus、AWS XRay 和 CloudWatch 的数据整合和关联到一个单一的控制面板中,并使用托管 Grafana。通过将用于指标和日志的不同数据源整合到 Grafana 仪表盘中,团队能够扩展其整体可观察性策略的广度。“我们的监控和可观察性不仅仅关乎 AWS 中的服务器、API 或资源使用情况,”Kushki 的云基础设施经理 Giacomo Orizzonte 说。“现在,我们关注的是如何在业务层面采用 Grafana Cloud 提供的工具,并利用它们来查看客户在我们平台上的成功情况。”
轻松上手
当团队通过 AWS Marketplace 购买 Grafana Cloud 时,他们不仅节省了时间,还将采购流程从几个月缩短到几天。他们还能够立即配置和实施可视化工具。“学习曲线很快,”Kushki 的 IT 架构经理 Javier Valencia 说。“对于任何人来说,从一个工具迁移到另一个工具都可能很痛苦,但我们的团队发现学习如何使用 Grafana 并不痛苦。”
双赢的合作关系
在决定从其现有的监控平台迁移到 Grafana Cloud 时,迁移的主要原因是 Grafana Labs 团队。“有了 Grafana Cloud,我们有一个在整个过程中帮助我们的提供商,所以这对他们和我们公司来说都是双赢的,”Javier Valencia 说。“Grafana 也诚实地介绍了他们的开发流程。路线图中哪些功能将被纳入对我们来说非常重要。”
一个平台,多种优势
当 Kushki 最初着手寻找新的可观察性工具时,他们专注于将所有数据整合在一起,以便更有效地监控其基础设施。他们从 Grafana Cloud 获得的解决方案能够实现更多功能。统一数据带来的洞察力为公司带来了额外的价值,帮助其识别可改进的领域以提高应用程序性能,同时还为高管提供了更深入的关键业务指标分析,例如交易成功率。
挑战
云基础设施和架构团队最初使用许多不同的工具来端到端跟踪所有客户的交易。然而,随着公司开始快速扩展,在确定出现的问题的根本原因时,在不同的平台之间切换变得越来越困难。“我们有一个工具可以查看技术问题,另一个工具可以查看业务问题,而这些问题与我们的可视化工具是分开的,”Javier Valencia 说。“因此,我们的主要目标是确定一个可以让我们全面了解系统状况的单一工具。我们还希望更好地了解交易不成功背后的真正原因——是技术原因?业务原因?开发团队做出的更改?”
解决方案
所有上述问题的答案都可以在 Grafana Cloud 中找到,它允许您访问和 统一 AWS 产品中的所有数据,例如 Amazon CloudWatch、Amazon Athena、Amazon OpenSearch Service、Amazon Redshift、Amazon Timestream 和 AWS X-Ray,以及 Elasticsearch、Graphite、InfluxDB 等第三方工具。他们还利用 Grafana 警报 来聚合不同的数据集以配置多维警报。“这对我们来说是一个新功能,帮助很大,”Giacomo Orizzonte 说。
结果
现在,当他们分析任何特定交易的成功情况时,团队可以立即访问有关响应时间、API 或 Rails 应用程序的数据,这些数据都显示在一个 Grafana 仪表盘中。但这仅仅是个开始。他们不仅可以更清晰地查看数据,还可以主动对洞察做出反应。“监控的补充是我们现在可以在一个地方直观地了解交易流程,”Giacomo Orizzonte 说。“通过这些可视化,我们能够了解我们可以在我们这边更改什么——我们的某些调用、库、组件——以便优化我们的响应时间。通过在 Grafana 中关联日志和 AWS X-Ray 数据,我们已经能够将 API 的响应时间缩短了三秒。”并且他们预计将来会看到更多好处。“我们正在使用 Grafana 机器学习进行更多探索,并且我们预计警报功能会有很多新的功能,”Giacomo Orizzonte 说。“Grafana 的未来一片光明。”