lageIBUSP / abacus

Documentação e scripts de administração do cluster Abacus
0 stars 1 forks source link

Cluster stat deveria informar sobre tráfego na rede #14

Open andrechalom opened 7 years ago

andrechalom commented 7 years ago

O recurso limitante para a execução dos scripts pode ser o uso de rede pelo NFS, agora que todos os nós estão no PXE. É preciso facilitar o monitoramento do uso de rede, possivelmente incluindo isso no cluster_stat.

renatocoutinho commented 7 years ago

Dei um primeiro passo nessa direção, num script processando a informação que sai do nfsiostat - ver /home/renato/bin/nfs_status.sh. Ele separa as informações de acordo com o ponto de montagem (/ /home e /cluster_bin) e tem informação demais, então peguei só duas: ops/s e rpc_bklog, que imagino que sejam operações/s total (read+write) e o tamanho (em Kb? bytes??) do backlog do rpc. O script soma esses números pros 3 pontos de montagem, talvez eles pudessem ser incorporados ao e exibidos na saída do cluster_stat.

Uma desvantagem do que fiz é que ele demora ~3s pra rodar, porque configurei pra tomar 1s de monitoramento, e ele roda separadamente pra cada ponto de montagem (isso poderia ser corrigido e rodado uma vez só sendo mais esperto no processamento da saída).