okfn-brasil / queriDO

nosso Querido Diário Oficial
https://okfn-brasil.github.io/queriDO/site
MIT License
18 stars 5 forks source link

Metodologia e ferramentas #51

Open ppKrauss opened 7 years ago

ppKrauss commented 7 years ago

A marcação semântica, principalmente de entidades nomeadas, já tem ferramentas consolidadas. A principal delas vem da equipe DBpedia que está firmando convênio com a OKBr (!), o projeto Spotlight,
http://www.dbpedia-spotlight.org/

A metodologia Spotlight pode ser resumida em 4 passos:

bsantosri commented 7 years ago

Peter Demais. Poderia me ajudar a entender melhor este fluxo descrito no gráfico?

Beijos! Bruna

Em 18 de jul de 2017 06:33, "Peter" notifications@github.com escreveu:

A marcação semântica, principalmente de entidades nomeadas, já tem ferramentas consolidadas. A principal delas vem da equipe DBpedia que está firmando convênio com a OKBr (!), o projeto Spotlight, http://www.dbpedia-spotlight.org/

A metodologia Spotlight pode ser resumida em 4 passos:

https://camo.githubusercontent.com/89ec86550e4b4ca37c955f3a00775d3f6921c490/687474703a2f2f7777772e646270656469612d73706f746c696768742e6f72672f696d616765732f697061642e6a7067

— You are receiving this because you are subscribed to this thread. Reply to this email directly, view it on GitHub https://github.com/okfn-brasil/queriDO/issues/51, or mute the thread https://github.com/notifications/unsubscribe-auth/AHppCmYNccCVRcAR2v-psgwxxTHr82NGks5sPHvcgaJpZM4ObFVE .

ppKrauss commented 7 years ago

Olá @bsantosri,

o uso de recursos semânticos mais sofisticados é opcional. O que fiz por exemplo no report01 é também semântico (garantia de que o termo marcado é name de Person) mas é automatizado. Apelamos para o Spotlight quando precisamos ainda mais marcações, e não temos como automatizar... Aí o Spotlight é como um assistente, vai ajudar a selecionar trechos do texto e marcações que fazem sentido.

Na figura o "spotting" é isso, determinar quais os fragmentos de conteúdo que serão alvo desse processamento assistido pelo Spotlight. Daí em diante a coisa seguiria como o site deles descreve.

Como ainda não temos interfaces bonitas e simpáticas, seriam os experts da equipe que preparariam todo o material para ser submetido ao Spotlight e, no final, alimentariam de volta a base de dados com o material marcado.

ppKrauss commented 7 years ago

Importante (!), essa issue não é "a metodologia", é um ticket, uma issue de sugestão de new feature, ou seja, a sugestão de incrementar o QueriDO através do uso do Spotlight.

Talvez precise mudar o título... A "metodologia geral do QueriDO" se baseia em duas vertentes:


Metodologia Serenata

Ver artigo Como cidadãos empoderados podem conversar com deputados? do Cuducos.

  1. Com base na Lei, nos autos da Justiça, nas verdades da Ciência e no bom-senso, a curadoria cria uma hipótese de como os atos registrados no Diário Oficial

    • podem ter uma origem regular ou ilícita;
    • podem ser consistentes ou inconsistentes;
    • podem ser evidência ou não (para ser somada a outras evidências já comprovadas).
  2. A curadoria, com ajuda dos experts, transcreve essa hipótese, em forma de asserções lógicas e queries (ex. SQL), para que ...

    2.1. os experts busquem nos milhões de textos quais casos batem com a hipótese, ou seja, quais dariam origem a suspeitas;

  3. A curadoria, ainda com algum suporte dos experts, audita manualmente os resultados e caso essa equipe de curadores corrobore a suspeita, denuncia-se o caso a jornalistas, juristas e outros especialistas;

  4. Quando essa outra comunidade responde (ou o próprio governo pela Lei de Acesso à Informação), aí sim a curadoria pode emitir um parecer, redige seu relatório com teor mais sério e definitivo, divulgando resultados específicos.