Open ppKrauss opened 7 years ago
Peter Demais. Poderia me ajudar a entender melhor este fluxo descrito no gráfico?
Beijos! Bruna
Em 18 de jul de 2017 06:33, "Peter" notifications@github.com escreveu:
A marcação semântica, principalmente de entidades nomeadas, já tem ferramentas consolidadas. A principal delas vem da equipe DBpedia que está firmando convênio com a OKBr (!), o projeto Spotlight, http://www.dbpedia-spotlight.org/
A metodologia Spotlight pode ser resumida em 4 passos:
— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/okfn-brasil/queriDO/issues/51, or mute the thread https://github.com/notifications/unsubscribe-auth/AHppCmYNccCVRcAR2v-psgwxxTHr82NGks5sPHvcgaJpZM4ObFVE .
Olá @bsantosri,
o uso de recursos semânticos mais sofisticados é opcional. O que fiz por exemplo no report01 é também semântico (garantia de que o termo marcado é name de Person) mas é automatizado. Apelamos para o Spotlight quando precisamos ainda mais marcações, e não temos como automatizar... Aí o Spotlight é como um assistente, vai ajudar a selecionar trechos do texto e marcações que fazem sentido.
Na figura o "spotting" é isso, determinar quais os fragmentos de conteúdo que serão alvo desse processamento assistido pelo Spotlight. Daí em diante a coisa seguiria como o site deles descreve.
Como ainda não temos interfaces bonitas e simpáticas, seriam os experts da equipe que preparariam todo o material para ser submetido ao Spotlight e, no final, alimentariam de volta a base de dados com o material marcado.
Importante (!), essa issue não é "a metodologia", é um ticket, uma issue de sugestão de new feature, ou seja, a sugestão de incrementar o QueriDO através do uso do Spotlight.
Talvez precise mudar o título... A "metodologia geral do QueriDO" se baseia em duas vertentes:
Revisão sistemática: ver por exemplo revisao-sistematica-da-literatura-o-que-e-como-fazer.
Ativismo baseado em hipótese-triagem-confirmação, vulgo "Metodologia Serenata"... Descrevo abaixo
Ver artigo Como cidadãos empoderados podem conversar com deputados? do Cuducos.
Com base na Lei, nos autos da Justiça, nas verdades da Ciência e no bom-senso, a curadoria cria uma hipótese de como os atos registrados no Diário Oficial
A curadoria, com ajuda dos experts, transcreve essa hipótese, em forma de asserções lógicas e queries (ex. SQL), para que ...
2.1. os experts busquem nos milhões de textos quais casos batem com a hipótese, ou seja, quais dariam origem a suspeitas;
A curadoria, ainda com algum suporte dos experts, audita manualmente os resultados e caso essa equipe de curadores corrobore a suspeita, denuncia-se o caso a jornalistas, juristas e outros especialistas;
Quando essa outra comunidade responde (ou o próprio governo pela Lei de Acesso à Informação), aí sim a curadoria pode emitir um parecer, redige seu relatório com teor mais sério e definitivo, divulgando resultados específicos.
A marcação semântica, principalmente de entidades nomeadas, já tem ferramentas consolidadas. A principal delas vem da equipe DBpedia que está firmando convênio com a OKBr (!), o projeto Spotlight,
http://www.dbpedia-spotlight.org/
A metodologia Spotlight pode ser resumida em 4 passos: