ddxygq / ddxygq.github.io

柯广的博客
http://www.ikeguang.com/
0 stars 0 forks source link

sparkStreaming消费kafka数据分区数少导致的数据拉取慢的问题 | 柯广的博客 #126

Open ddxygq opened 4 years ago

ddxygq commented 4 years ago

http://www.ikeguang.com/2018/08/29/spark-kafka-partition/

sparkStreaming消费kafka数据,实时统计pv,uv,由于业务拓展,数据量暴增,导致数据量增大,导致程序在一个batch时间间隔内不能处理完。