Prometheus正式从CNCF毕业-白红宇

Prometheus正式从CNCF毕业

阅读量：6761 次

发布时间：2019-06-26

本文共 1473 字，大约阅读时间需要 4 分钟。

2018年8月9日，云原生计算基金会（CNCF）宣布开放源代码监控工具Prometheus已从孵化状态进入状态。要到达这一评级，一个项目必须展示其增长，文档、有组织的治理流程、对社区可持续性和包容性的承诺。

随着越来越多的组织继续构建云原生应用程序，监控这些分布式应用程序变得非常重要。为此，提升Prometheus在CNCF中的地位是很有意义的。 CNCF首席运营官Chris Aniszczyk解释道：

\

自2012年成立以来，Prometheus已成为企业首选的构建现代云原生应用程序的开源监控工具之一。 Prometheus培养了一个活跃的开发者和用户社区，让技术监督委员会（TOC）有足够的信心让这个项目毕业。
\

为了从一个孵化状态逐渐升级到一个毕业状态，一个项目必须遵循CNCF行为准则，进行独立的安全审计，并披露其治理结构，概述他们计划如何发展他们的社区。开源社区中有很多人对Prometheus的毕业表示赞许，包括SUSE CTO Thomas Di Giacomo。

\

它是对云原生计算基金会项目（如Kubernetes和其他分布式系统）的一个很好的补充。Prometheus的毕业是对它在技术、社区成熟度以及为广泛的用例带来价值的认可。
\

SoundCloud（一个流媒体音乐和播客服务）于2012年发布了Prometheus，并于2016年5月捐献给了CNCF。自进入孵化阶段以来，已发布了30个官方主要和次要版本。

在2017年GOTO大会中，SoundCloud的产品工程师Björn Rabenstein介绍了开发Prometheus背后的一些驱动因素，其中一个因素是因为黑盒监控不是很有效。CERT高级开发团队负责人Joeseph Yankel将黑盒测试定义为：

\

一种用于检查系统或应用程序的方法（例如检查磁盘空间或ping主机），以查看主机或服务是否处于活跃状态，但无法帮助你了解它是如何进入当前状态的。
\

图片来源：(截屏）

相反，Prometheus采用了一种白盒测试方法，通过时间序列方法可以知道达到当前状态的路径。转而采用这种方法的另一个驱动因素是SoundCloud通过DevOps的方式来监控他们的系统。Rabenstein将此称为“你构建，你运行”。如果使用之前的黑盒方法，产品最终被扔给没有太多相关背景的运营团队去管理。而现在，SoundCloud专注于通过在代码或统计表中包含指标来从头开始构建监控功能。

通过利用白盒监控，Prometheus的警报机制变得更加智能化。Prometheus不仅可以依靠阈值，还可以利用时间序列方法。Rabenstein演示了一个场景，把磁盘的阈值设置为85%，并使用传统的方式进行监控。然而，即使磁盘可用容量没有达到阈值也会触发警报。而改用时间序列趋势，当趋势线预测即将发生磁盘中断时就会发送警报。Rabenstein认为，对于轮班待命的工程师来说，为了避免警报疲劳，需要尽量减少不必要的警报。

图片来源：(截屏）

除了利用趋势线之外，Prometheus还提供了一种方法用于构建警报路由树，以及分组或捆绑通知的功能。因此，如果底层的主机出现故障，就只发送单个警报，而不是针对该主机上运行的每个服务发送一个警报。

图片来源：(截屏）

有关Prometheus的里程碑及其在CNCF状态的更多信息，请访问这个。

查看英文原文：

转载地址：http://ehbeo.baihongyu.com/

你可能感兴趣的文章

一位老码农的分享：一线程序员该如何面对「中年危机」？