Open harryteng9527 opened 1 year ago
related https://github.com/skiptests/astraea/pull/1524#issuecomment-1559351373
此 issue 拿來討論實驗中使用 Cost-Aware assignor 的 consumers 端對端延遲有時候會到 20 多秒
下圖 partition lag 的圖是抓 Kafka consumer 紀錄的 Lag 所繪製的圖
上面 partition lag 的圖中,使用 Cost-Aware assignor 的 consumers 會追不上兩個 partitions 的 Lag,而使用 Range assignor 的 consumers 追不上的 partitions 數量更多
我去看了一下 Cost-Aware 中 consumers 的端對端延遲,看到被分配到這兩個 partitions 的 consumer 的端對端延遲有時會特別高(下圖的 Consumer[1] 70)
Consumer[1] 70
看它(Consumer[1] 70)的分配沒有被流入速率低的 partition 影響,但被分配的 cost 是最重的,比平均高 50 MiB,所以可能是來不及處理導致資料一直堆積,產生過高的 e2e latency
所以可能是來不及處理導致資料一直堆積,產生過高的 e2e latency
這句話講的是結果而不是原因,可否試著分析一下為何會有如此的落差?如果一開始資料寫入就很平衡的話,還會有如此落差嗎?
related https://github.com/skiptests/astraea/pull/1524#issuecomment-1559351373
此 issue 拿來討論實驗中使用 Cost-Aware assignor 的 consumers 端對端延遲有時候會到 20 多秒
Partition Lag
下圖 partition lag 的圖是抓 Kafka consumer 紀錄的 Lag 所繪製的圖![partitionLAg](https://github.com/skiptests/astraea/assets/90374678/fe4495b7-005e-4186-8498-78585140c1cf)
上面 partition lag 的圖中,使用 Cost-Aware assignor 的 consumers 會追不上兩個 partitions 的 Lag,而使用 Range assignor 的 consumers 追不上的 partitions 數量更多
我去看了一下 Cost-Aware 中 consumers 的端對端延遲,看到被分配到這兩個 partitions 的 consumer 的端對端延遲有時會特別高(下圖的![Consumers 的端對端延遲](https://github.com/skiptests/astraea/assets/90374678/e4e779fe-20fe-4d49-b3e0-fcc9a7fd625d)
Consumer[1] 70
)看它(Consumer[1] 70)的分配沒有被流入速率低的 partition 影響,但被分配的 cost 是最重的,比平均高 50 MiB,所以可能是來不及處理導致資料一直堆積,產生過高的 e2e latency