Prometheus rate & irate
背景
实例状态、服务状态、Spring MVC 接口等相关监控打点看板基本都由架构、运维实现
但业务中会存在和业务数据更密切的监控需求,一般也使用 Prometheus 或类似的数据库来实现
对于 Prometheus 的函数选择存在一些疑问,所以写了这边文档,着重关注
rate
和 irate
的实现原理和实践方法,可以解释以下问题
- 为什么一个 QPS 看板缩小时间窗口后,某个点的 QPS 会上升
rate
和irate
的区别和实现方式是什么;以及increase
和delta
- 时间窗口内数据 range-vector 和步长 step Interval 之间的关系
- 如何选择合适的函数
- 聚合函数和时间向量函数的区别