Open cnych opened 4 years ago
https://www.qikqiak.com/post/use-loki-monitor-alert/?utm_source=webpushr&utm_medium=push&utm_campaign=webpush273260
对于生产环境以及一个有追求的运维人员来说,哪怕是毫秒级别的宕机也是不能容忍的。对基础设施及应用进行适当的日志记录和监控非常有助于解决问题,还可以帮助优化成本和资源,以及帮助检测以后可能会发生的一些问题。前面我们介绍了使用 EFK 技术栈来收集和监控日志,本文我们将使用更加轻量级的 Grafana Loki 来实现日志的监控和报警,一般来说 Grafana Loki 包括3个主要的组件:Promtail、Loki 和 Grafana(简称 PLG),最为关键的是如果你熟悉使用 Prometheus 的话,对于 Loki 的使用也完全没问题,因为他们的使用方法基本一致的,如果是在 Kubernetes 集群中自动发现的还具有相同的 Label 标签。
最后告警通过 Prometheus 触发的吗?那这样就不是日志触发的告警了呀?
@Xiechengqi 这个是因为当时写这篇文章的时候 Loki 还没有自带的报警功能,要使用 Loki 提供的报警组件进行报警可以参考我这篇文档:https://www.qikqiak.com/k8strain2/logging/loki/alert/
https://www.qikqiak.com/post/use-loki-monitor-alert/?utm_source=webpushr&utm_medium=push&utm_campaign=webpush273260
对于生产环境以及一个有追求的运维人员来说,哪怕是毫秒级别的宕机也是不能容忍的。对基础设施及应用进行适当的日志记录和监控非常有助于解决问题,还可以帮助优化成本和资源,以及帮助检测以后可能会发生的一些问题。前面我们介绍了使用 EFK 技术栈来收集和监控日志,本文我们将使用更加轻量级的 Grafana Loki 来实现日志的监控和报警,一般来说 Grafana Loki 包括3个主要的组件:Promtail、Loki 和 Grafana(简称 PLG),最为关键的是如果你熟悉使用 Prometheus 的话,对于 Loki 的使用也完全没问题,因为他们的使用方法基本一致的,如果是在 Kubernetes 集群中自动发现的还具有相同的 Label 标签。