Open ppKrauss opened 2 years ago
@ppKrauss a maioria dos campos das planilhas donor e donatedPack podem ser preenchidos automaticamente, sem intervenção do analista. O preenchimento automático também evitaria erros humanos. Uma forma de abordar o preenchimento automático, ao mesmo tempo que incluindo um manual para preenchimento dos campos manuais, é utilizando um questionário.
Adicionei outros comentários e dúvidas neste documento. Sugiro agendarmos uma conversa para discutir os próximos passos.
Sugestão do @ppKrauss: utilizar received_date no lugar de accepted_date
"a data de aceitação tem vies, a data de doação é a de Received... Mas seria essa data dentro do conjunto dos accepteds (ou publicados)".
Atualmente, o responsável por manter planilha coloborativa é o @IgorEliezer. Construir forma automatizada de atualizar donor.csv com planilha mantida por ele. Ou, periodicamente, fazer atualizações manuais enquanto não for possível faze-lo automaticamente via target.
Relacionada: https://github.com/digital-guard/preserv-BR/issues/167
As planilhas
donor.csv
edonatedPack.csv
são essenciais e controlam todos os identificadores do sistema, sendo também pré-requisto para a entrada de novos dados. É importante que seus dados sejam o mais simples e objetivos possível para que humanos possam controlar seus dados.No workflow de atualização dessas planilhas, outro recurso para tornar a atualização mais amigável e atrativa à colaboração, foi adotado o uso da planilha colaborativa Google-docs, ao invés da interface pobre do Github, ou o trabalho de baixar e abrir num software externo como LibreOffice. O passo-a-passo da gestão das atualizações é o seguinte:
donor.csv
e então confere o resultado com o comandogit diff donor.csv
.Se detectar diferenças não-previstas, corrige a planilha colaborativa ou, em caso de novos dados ou nova estrutura de dados, confere com o restante da equipe o que fazer. Novas linhas de donor podem estar incompletas apenas no caso de sua coluna "status" não estar em "active" (por exemplo "inactive" ou "prospecting").
git add; git commit -m "new donors"; git push
.donatedPack.csv
e então confere o resultado com o comandogit diff donatedPack.csv
.Se detectar diferenças não-previstas, corrige a planilha colaborativa ou, em caso de novos dados ou nova estrutura de dados, confere com o restante da equipe o que fazer.
git add; git commit -m "new packs"; git push
.(atualmente o procedimento é um make target mas no futuro poderá ser automatizado por Observer do git).
O workflow só vai funcionar se as estruturas das planilhas (cabeçalho das colunas) colaborativa e CSV forem exatamente as mesmas e a planilha colaborativa for inicialmente preparada com o conteúdo do CSV oficial. Importante notar que, na dúvida, a informação confiável é a contida no CSV.
Empreitada conjunta
A divisão de tarefas ainda não está clara, mas seriam as seguintes:
Correção da planilha
Foram incluídas as colnas `status" em ambas, e a forma de registro das licenças mudou, demandando agora garantia de JOIN com projeto Licences e registro dos rótulos de licença implícita, bem como distinção entre família de licença e licença.
Correção de software
scope_osm_id
que pode ser deduzida por Jurisdiction através descope_label
(deixa de ser cache).