danielqsj / kafka_exporter

Kafka exporter for Prometheus
Apache License 2.0
2.2k stars 612 forks source link

error: collected before with the same name and label values #157

Open jinleileiking opened 4 years ago

jinleileiking commented 4 years ago

An error has occurred during metrics gathering:

1178 error(s) occurred:

jinleileiking commented 4 years ago

我debug了一下,发现是这个问题: 我的broker里会遇到两个broker都有一个 consumer group的情况: 比如 broker 1 -> cg 1 也会出现 broker 2 -> cg1 然后导致异常,我不知道这个异常是kafka出问题,还是正常现象。 改了个diff,作者有空看看。

huoarter commented 3 years ago

@jinleileiking 我也遇到这个问题,在你的基础上调试看了一下,是kafka consumer_offsets 数据可能有问题,导致查看consumergroup有异常存在。如下可以看到有两个相同的group : elklogstash-sre,其中一个是数据问题导致的,并没有members。

/opt/kafka_2.12-0.11.0.3/bin/kafka-consumer-groups.sh --bootstrap-server pre-zbkafka-002:9092 --list

KMOffsetCache-11c6174c8eca
elklogstash-sre
gohangout-k8s
elklogstash-sre
logstash.hdfs

另外:有关你提交的pr的逻辑会影响指标收集结果的有点问题,其实只要判断 len(group.members) == 0 {conitnue}就可以了。

FantasticLiar commented 3 years ago

@jinleileiking 我也遇到这个问题,在你的基础上调试看了一下,是kafka consumer_offsets 数据可能有问题,导致查看consumergroup有异常存在。如下可以看到有两个相同的group : elklogstash-sre,其中一个是数据问题导致的,并没有members。

/opt/kafka_2.12-0.11.0.3/bin/kafka-consumer-groups.sh --bootstrap-server pre-zbkafka-002:9092 --list

KMOffsetCache-11c6174c8eca
elklogstash-sre
gohangout-k8s
elklogstash-sre
logstash.hdfs

另外:有关你提交的pr的逻辑会影响指标收集结果的有点问题,其实只要判断 len(group.members) == 0 {conitnue}就可以了。

您好,我遇到了同样的问题,请问有什么方式解决吗,例如删除掉异常的group

jinleileiking commented 3 years ago

@jinleileiking 我也遇到这个问题,在你的基础上调试看了一下,是kafka consumer_offsets 数据可能有问题,导致查看consumergroup有异常存在。如下可以看到有两个相同的group : elklogstash-sre,其中一个是数据问题导致的,并没有members。

/opt/kafka_2.12-0.11.0.3/bin/kafka-consumer-groups.sh --bootstrap-server pre-zbkafka-002:9092 --list

KMOffsetCache-11c6174c8eca
elklogstash-sre
gohangout-k8s
elklogstash-sre
logstash.hdfs

另外:有关你提交的pr的逻辑会影响指标收集结果的有点问题,其实只要判断 len(group.members) == 0 {conitnue}就可以了。

您好,我遇到了同样的问题,请问有什么方式解决吗,例如删除掉异常的group

用我的这个patch,可以凑合用,归根结底是kafka集群状态不对