Open AndreaSanchezTapia opened 7 years ago
Bem observado. O snowfall
, que estivemos usando até o momento, só dá a opção de jogar toda saída padrão e de erros para um arquivo único. Filtrar o que significa sucesso e o que significa erro ali é complicado. Preciso experimentar outras formas de paralelismo também. Conseguirei fazer isso quando terminar de instalar as dependências todas no Santos Dumont.
Antes da paralelização tinha um sistema de aviso com cat
que contava em que pé estava tudo. Não serve mais desde que snowfall opera por cima mas a posição original dessas mensagens é um bom começo para ver quais etapas dão mais erro.
Vamos listar os erros possíveis, informá-los aqui e implementar as checagens referenciando essa issue.
Estive checando e mais do que um sistema de erros eu tinha um sistema que anunciava o andamento da modelagem -para saber o que estava rodando e em qual etapa parava. Estou montando a lista e realmente tem vários itens aqui que podem ser resolvidos implementando algum passo que cheque isso, sem necessidade de serem erros ou warnings, mas deixo aqui por enquanto.
Erros e warnings possíveis (lista em construção)
Pré modelagem:
Modelagem:
Final model e ensemble:
A modelagem pode dar erro em vários momentos e precisamos de avisos para deter a rodada caso tenha algum problema, ou avisar por meio de
warnings()
quais algoritmos rodaram, quantas partições foram retidas e se houve algum problema. Isto está escrito em várias partes do backend mas precisamos que o front-end entenda e mostre.