Open zengzhaozheng opened 9 years ago
\ Owl只支持一些简单的报警,例如hdfs namenode等状态的check,如果出现问题,例如ha问题等,owl会报警;这个在owl/alert模块中。
\ 另外还支持hdfs quota方面的报警,例如某个用户的quota超阈值了,Owl会报警了;这个在owl/quota模块中。
\ 对于集群进程的监控报警主要是基于supervisord的,如果done掉,supervisord会报警并自动拉起;
\ 对于metrics方面的报警,我们这边是将metrics收集起来以后推送给一个公司统一的报警系统,在里面配置一下,这方面的报警由他们来报
通过什么方式报警的,email方式吗,还是其他的?
嗯,owl这块是email和米聊;metrics方面还有短信
现在GItHub上的Minos版本支持spark和storm监控吗?还有,这个Minos有没有报警功能的?