MPMG-DCC-UFMG / C01

Coleta de Dados Públicos
GNU General Public License v3.0
18 stars 9 forks source link

Coleta geral do portal de transparência de Teófilo Otoni #752

Open RitaRez opened 3 years ago

RitaRez commented 3 years ago

Comportamento Esperado

Requisição da extração de páginas html do portal da prefeitura de Teófilo Otoni. A extração tem o objetivo de obter dados para a criação de validadores para identificar a presença de itens no portal de transparência da prefeitura de Teófilo Otoni.

Comportamento Atual

Uma issue já havia sido criada previamente e os dados coletados, contudo é necessário que a coleta seja realizada novamente pois a atual apresenta problemas com caracteres especiais.

Localização

Não possui nenhuma coleta atualmente. Para fins de organização separar dados a nível de município (e.g. /datalake/ufmg/webcrawlerc01/realizacaof01/Teófilo Otoni).

Detalhes da Fonte

Os dados a serem extraídos podem ser encontrados no portal da prefeitura de Teófilo Otoni, nos seguintes links: •https://teofilootoni.mg.gov.br/https://transparencia.teofilootoni.mg.gov.br/portalcidadao/#efb33c382dcf9e4ae2294337ce2a566034ee25478c90493e56f55878a4d19d547154abb93a539ca141901243121b0442f68667740d76583a9b6fc842805a701255f50abffb83548323feb3d4a215dcba05fc4b5b868699999c1d78af95bbbed2ae7ab27d940f9f7a8b2debb75557ba1cd7f6303c3be5a0edaecf72a00208c722773c5ec1c75725b2

E todos os html das primeiras páginas alcançáveis a partir de: •https://transparencia.teofilootoni.mg.gov.br/portalcidadao/#efb33c382dcf9e4ae2294337ce2a566034ee25478c90493e56f55878a4d19d547154abb93a539ca141901243121b0442f68667740d76583a9b6fc842805a701255f50abffb83548323feb3d4a215dcba05fc4b5b868699999c1d78af95bbbed2ae7ab27d940f9f7a8b2debb75557ba1cd7f6303c3be5a0edaecf72a00208c722773c5ec1c75725b2

Para essa coleta, é necessário aguardar o carregamento de cada página.

Detalhes da Trilha

Os dados aqui solicitados são de interesse da trilha F01, sob coordenação de Rodrygo Santos (rodrygo@gmail.com).

Screenshots e Links

Não se aplica.

pedrohandrade1 commented 3 years ago

bug descrito em #764