Seria útil saber através da interface se algum dos servidores do domínio de
processamento ficou inacessível, de maneira a tomar uma decisão sobre fluxos
pendentes (em execução ou em fila). Um servidor pode apenas ficar sem rede ou
pode ser desligado, por exemplo. Nestas circunstâncias, o maestro ficariam
esperando indefinidamente por seu retorno para dar um job por concluído.
Isto poderia ser verificado se cada servidor realizasse um touch em um arquivo
determinado, no NFS, periodicamente. O maestro ficaria monitorando tais
arquivos, também regularmente. Caso um desses arquivos ficasse inalterado por
muito tempo, significaria que o servidor correspondente estaria fora do ar.
Original issue reported on code.google.com by bil...@gebrproject.com on 2 Sep 2013 at 4:05
Original issue reported on code.google.com by
bil...@gebrproject.com
on 2 Sep 2013 at 4:05