roneysco / Fake.br-Corpus

We introduce the Fake.Br Corpus, which is composed of aligned true and fake news written in Brazilian Portuguese.
165 stars 46 forks source link

Como usar o repositorio #3

Open samuel-carleial opened 4 years ago

samuel-carleial commented 4 years ago

Olá @roneysco , muito interessante usar text mining pra detect fake news das noticias no Brasil. Gostaria de saber como usar o repositório. Existe alguma ferramenta ou manual? Desculpa nao ler a fundo a pubblicacao, mas queria so um resumo mesmo da utilidade do seu repositorio.

Seria possivel pensar num site para o publico leigo, onde facilmente pessoas poderiam pesquisar frases ou textos com uma ferramenta de busca, para saber se uma noticia é fake ou nao?

Isso seria sem sombra de duvidas muito interessante

roneysco commented 4 years ago

Olá @samuel-carleial!

Bom, é um dataset, então geralmente é usado para testes de métodos automáticos. Caso você queira extrair características linguísticas, classificar a notícia, entre várias outras tarefas. O dataset é a entrada para o teste desses métodos.

Então, essa ferramenta é realmente super útil, porém, precisa de dados atualizados praticamente a todo momento, pois notícias novas são lançadas a cada minuto. O intuito desse repositório/dataset é propor métodos para tais classificações automáticas, por meio inteligência artificial, por exemplo.

Obrigado pelos elogios! Fico à disposição!