cloudnativecube / octopus

14 stars 2 forks source link

CK监控项整理 #120

Open Cas-pian opened 3 years ago

Cas-pian commented 3 years ago

管理员、用户在使用CK的过程中需要关注CK的监控,方便判断系统是否正常,以及为debug做决策。

Cas-pian commented 3 years ago

CK管理员关注的监控指标:

系统:

CPU:使用率(user, sys)、Load、Context Switch 网络:net sent、net transmit、tcp resend 磁盘:IO Util、IOPS、Read、Write、磁盘使用率 内存:内存使用,swap, major page fault

Clickhouse:

基础:CPU、Memory、Disk 统计:维度:库、表、Partition、Part,指标:Rows、Bytes、压缩比 导入:按库、表、用户统计写入大小、行数(秒/分钟) 查询:QPS、查询失败率、TP75/90/99、Scan大小和行数、dictionary命中率 后台:Merge、Compaction、Alter(update/delete/drop)...

Zookeeper:

基础:CPU、Memory、Disk znode: ZNode Count net: Net Connection/Send/Receive、average latency,TP99

Cas-pian commented 3 years ago

CK用户关注的监控指标:

系统:

CPU:使用率(user, sys)、Load 网络:net sent、net transmit 磁盘:IO Util、IOPS、Read、Write、磁盘使用率 内存:内存使用

Clickhouse:

基础:CPU、Memory、Disk 统计:维度:库、表、Partition、Part,指标:Rows、Bytes 导入:按库、表统计写入大小、行数(秒/分钟) 查询:QPS、查询失败率、TP75/90/99、Scan大小和行数、dictionary命中率

Cas-pian commented 3 years ago

@mdianjun 这是整理的的CK相关的监控项,需重点提供

Cas-pian commented 3 years ago

Clickhouse 监控board(管理员)OK了:http://centos00:3000/d/A3WWXWz7k/clickhouse-metrics