使用 Grafana Enterprise 监控 22,000 个站点上的可再生能源:Agregio 的可观测性堆栈揭秘
世界各地的 DevOps 和 SRE 团队都使用 Grafana 来可视化分布式基础设施和应用程序的数据。在巴黎郊区,Agregio 也使用 Grafana 来监控分布式系统——只不过不是您预期的那种。
Agregio 是法国电力公司 (Électricité de France S.A.),简称 EDF 的子公司,该公司是一家主要由法国政府控股的跨国电力公司。Agregio 整合了法国 22,000 多个站点的可再生能源,并将其回售给电网。该公司需要确保这些分布式地点的产出达到预期,而业务运营团队依赖 Grafana 来确保这一点。
诚然,Grafana 的设计考虑到了 IT 专业人员,但正如我们一次又一次看到的那样,人们以各种意想不到的方式使用它。这种多样性说明了 Grafana 仪表盘的强大之处,它可以快速获取概况,也可以深入挖掘系统健康状况。在 Agregio 的案例中,它正在为一家试图利用电网去中心化发电能力并应对气候变化的公司提供关键的商业价值。
以下是 Agregio 如何实施 Grafana,以及这一成功如何促使这家能源聚合商希望与 Grafana Labs 加倍合作的简要概述。
Agregio 为何开始使用 Grafana
尽管隶属于法国最大的能源生产商旗下,Agregio 本质上是一家敏捷的初创公司。该公司成立于 2017 年,在努力成为欧洲能源生产管线不可或缺的一部分时,可以快速进行变革——无论是业务上的还是所使用工具上的。
这些变革之一发生在首席技术官 Sony Tricoire 大约一年前加入公司时。当时 IT 团队一直在构建定制图表,以便 Agregio 的业务运营团队能够跟踪 Agregio 客户的发电量。然而,这个过程既繁琐又耗时,而曾在前公司使用 Grafana 和 InfluxDB 后端监控 IT 资产的 Sony Tricoire 看到了在 Agregio 快速应用它的机会。
“与其花费大量时间构建那些图表,我建议改用一个成熟的解决方案——Grafana,” Sony Tricoire 说道。
从 Grafana OSS 到 Grafana Enterprise:Agregio 为何选择升级
Agregio 与许多不同的利益相关者合作。首先,他们与可再生能源生产商合作,无论是屋顶上装有几个太阳能电池板的房主,还是拥有大量风力发电机的公司。他们还帮助能源消费者降低电费,并协助资产经理最大化电池和冷藏设施中已生产能源的价值。Agregio 利用其在能源市场和监管体系方面的专业知识,帮助生产商获得长期供电合同,并帮助消费者减少对化石燃料的依赖。总的来说,Agregio 的 22,000 个站点可以生产足够的电力,相当于六个核反应堆的发电量。
Agregio 仪表盘,突出显示法国国家电网平衡和价格
Agregio 团队由能源市场、监管系统和可再生能源管理方面的专家以及预测和优化方法及算法专家组成。
“我们正在努力将能源生产从大型资产(如燃气或燃煤发电厂)去中心化到更分散的可再生能源生产商,”Sony Tricoire 说道。“而随着去中心化的到来,协调各方以满足消费者需求的复杂性也随之增加。”
Sony Tricoire 有使用监控和图表工具的经验,但“如果您看看 Datadog 这样的工具,它们完全专注于 IT 受众,”他说道。“我想确保我们使用的工具也能用于非 IT 目的。”
他知道 Grafana 符合易用性的要求,并且欣赏它处理多个数据源的能力。作为概念验证,“我们从一个 Grafana 的 OSS 实例开始,并将其连接到我们的 PostgreSQL 数据库。我们构建了两到三个图表,展示给业务部门看,他们非常喜欢,”Sony Tricoire 说道。“他们喜欢构建工作所需的合适图表的简单性。”
Agregio 仪表盘展示了用于频率维持储备估值的电池控制
由于 Agregio 充当可再生能源生产和消费的中介,其 12 人的运营团队和其他几个内部利益相关者非常欣赏 Grafana Alerting 的好处。他们使用该工具设置某些阈值来触发告警,这使得他们能够及时采取行动。例如,如果他们的电力输出不符合预期,可能会对 Agregio 产生潜在的财务影响。通过能够快速行动,他们可以实施对策以减少潜在的财务影响。他们会注意到能源资源的不平衡。他们还喜欢 Grafana 图表可以轻松地在团队成员和高管之间共享,并且这些图表是动态的,因此可以根据实时事件对能源供需的影响来操作数据,从而即时回答问题。
使用 Grafana,我们可以轻松地在一个中心位置比较来自多个数据源生成的多个仪表盘。这给了我们可视化更多以前无法可视化的东西的自由,这意味着当我们面临关键业务决策时,我们可以安心地拥有所需的所有数据点就在眼前。
Sony Tricoire,Agregio 首席技术官
虽然 Agregio 最初使用的是 Grafana OSS,但该公司很快转向了 Grafana Enterprise,以获得额外的 SSO 认证支持。
“在能源领域,我们面临网络安全攻击的高风险,我们需要严格的安全政策来访问我们的工具,”Sony Tricoire 说道。“即使 Grafana 是只读的,我们也不想承担任何风险,Grafana Enterprise 中原生的安全和访问控制帮助我们解决了这些担忧。”
使用 Grafana 监控多项资产以达成承诺
Agregio 计划如何扩展其 Grafana Enterprise Stack
展望未来,IT 团队正在评估更多方法来帮助业务运营,包括跟踪长期使用和供应模式以调整季节性,并能够更快地检测生产问题。这将帮助他们更好地预测未来产量,以便根据他们在数据中看到的情况(包括分析斜率和梯度,而不仅仅是离散值)在市场上提供更具竞争力的报价。
最重要的是,我们的运营团队能够从 Grafana 中获得比我们之前提供的更多信息和更高的效率。
Sony Tricoire,Agregio 首席技术官
团队对 Grafana 在业务方面的帮助非常满意,现在他们也打算将其应用于 IT 方面。他们目前使用 Amazon CloudWatch 和 AWS X-Ray 监控其 AWS 环境,但正在考虑用 Grafana 替换它们。
“CloudWatch 和 X-Ray 一点都不对开发者友好,也无法帮助团队日常参与并掌控代码和基础设施的行为,”他说道。“没有合适的工具,他们很难进行运营管理。”
为了转向更敏捷的 CI/CD 方法,他们正在考虑使用 Grafana Enterprise Stack 来帮助他们在这一转变中取得成功。
我们期望用 Grafana 为 IT 团队做的是,提供给我们的开发团队一个合适的视图,让他们随时随地了解他们的代码和我们的基础设施是如何运行的。这将使我们在 IT 方面出现问题时更加迅速地做出反应。
Sony Tricoire,Agregio 首席技术官