Open xizhibei opened 7 years ago
请问下prometheus监控k8s到底需要哪几个配置文件,我在网上看了好多,但似乎陈述得都有点乱
@mac-zhang 在 k8s 集群内部安装的配置文件只需要这个配置: https://github.com/prometheus/prometheus/blob/master/documentation/examples/prometheus-kubernetes.yml
I config alert use prometheus.yml like this: alerting: alertmanagers:
prometheus pod start failed, error log is this: level=error ts=2017-11-18T07:47:24.596566741Z caller=manager.go:485 component="rule manager" msg="loading groups failed" err="yaml: line 7: mapping values are not allowed in this context" level=error ts=2017-11-18T07:47:24.596595776Z caller=main.go:413 msg="Failed to apply configuration" err="error loading rules, previous rule set restored" level=error ts=2017-11-18T07:47:24.596718947Z caller=main.go:356 msg="Error loading config" err="one or more errors occurred while applying the new configuration (--config.file=/etc/prometheus/prometheus.yml)"
自从 上次 介绍了 Prometheus 之后,就想到要在 k8s 中使用了,不过,在这之前,先介绍下 k8s 的监控。
k8s 的监控
k8s 默认以及推荐的监控体系是它自己的一套东西:Heapster + cAdvisor + Influxdb + Grafana,具体可以看 这里 。
包括 k8s 自身的 HPA (Horizontal Pod Autoscaler),默认从 Heapster 中获取数据进行自动伸缩。(顺便提一句,当你部署完 k8s 集群之后,如果从 Dashboard 中看不到监控数据,往往就是因为你没有部署 Heapster,或者网络层有问题, Dashboard 无法访问 Heapster。)
那,这跟我们介绍的 Prometheus 有什么关系?
首先,它们都是一套监控解决方案,而 k8s 没有把 Prometheus 作为默认监控,因此,如果你想直接使用 HPA,你还是需要部署 Heapster。
其次,kubelet 中的 cAdvisor 其实是支持 Prometheus 作为存储的后端的,只是相对于 Prometheus 自己的 SD 解决方案来说,太弱了点。
最后,k8s 1.6 之后,在 annotations 中配置 custom metrics 的方式已经被移除了,而根据 Prometheus 的监控数据来进行自动伸缩还是很有可操作性的。
部署
其实部署很简单,关键是配置,因此这里着重介绍下,如何配置。
Relabel
首先,先来了解下,什么是 relabel_config。
就如字面意思而言,它的作用是 Prometheus 抓取 metrics 之前,就将对象相关的 labels 重写。下面是它几个重要的 label:
Kubernetes SD
其次,上次提到,我们可以用到 Service Discovery 这个功能,其中就包含 Kubernetes SD。
它包含四种角色:
由于篇幅所限,这里只是简单介绍下其中的 node 还有 pod 角色:
接下来的这个 pod 角色挺重要:
在定义了这个角色之后,你只要在你部署的应用 Pod 描述中,加入以下 annotations 就能让 Prometheus 自动发现此 Pod 并采集监控数据了:
其它详细配置请看 这里。
Kubernetes Deployment
最后,部署 Prometheus,需要注意的是,我们已经在 k8s 之外单独部署了一套,为了统一处理,在这里是打算作为中转的。
Prometheus Federate
而在我们外部单独的 Prometheus 中,需要配置 Federate,将 k8s 中 Prometheus 采集的 metrics 全部同步出来。