okfn-brasil / observatorio-materiais

Organização de materiais referentes ao Observatório de Tecnologias na Educação
MIT License
1 stars 0 forks source link

Indicar ocorrência de duplicatas no dataset #12

Closed ogecece closed 2 years ago

ogecece commented 2 years ago

DESCRIÇÃO: Durante a pré-análise da base de dados de resultados, foram identificadas entradas duplicadas. A análise será aprofundada para identificar as causas das duplicações e, para isso, é necessário apontar especificamente quais são as entradas repetidas.

OBJETIVO: Identificar e destacar a ocorrência de duplicatas no primeiro dataset gerado, a partir de uma amostra dos resultados.

DEFINIÇÃO DE PRONTO Amostra de duplicatas identificadas para subsidiar a investigação da equipe de IC.

adanibello commented 2 years ago

Refinando a análise, identificamos algumas inconsistências que induziram ao erro em relação a essa questão específica das duplicatas:

adanibello commented 2 years ago

Com isso, podemos fechar esta ação, e focar na questão do refinamento dos termos de busca e escopo dos resultados!

adanibello commented 2 years ago

Inclusive, @giuliocc , acredito que podemos reformular a #19 e jogá-la mais pra frente para abranger a questão do refinamento do escopo (que ainda depende de outras ações, inclusive a geração da base com a lista de termos já atualizada).

ogecece commented 2 years ago

Beleza @adanibello ! Que ótimo que os resultados estavam melhores!

Sobre as diferenças entre os casos não estarem aparecendo nos excertos, vocês diriam que o problema pende mais pra que lado?

ogecece commented 2 years ago

A partir da base nova vamos conseguir definir os pontos acima.