MPMG-DCC-UFMG / C01

Coleta de Dados Públicos
GNU General Public License v3.0
18 stars 9 forks source link

Detecção de encoding via bytes em páginas dinâmicas #713

Open elvesmrodrigues opened 3 years ago

elvesmrodrigues commented 3 years ago

Comportamento esperado

Em páginas estáticas, é possível detectar a codificação de uma página coletada de duas formas: via cabeçalho de resposta do servidor ou por inferência a partir dos bytes da coleta.

Isso não acontece em páginas dinâmicas, pois o conteúdo da página coletada é obtido via código javascript e a detecção da codificação suportada é somente via cabeçalho da resposta do servidor.

Então é necessário investigar o uso desse método automático nesses casos.

Ver discussão: https://github.com/MPMG-DCC-UFMG/C01/pull/666#discussion_r688780362

Comportamento atual

Só há suporte a detecção de codificação via cabeçalho de resposta no servidor.

Passos para reproduzir o erro

rennancl commented 2 years ago

Hey team! Please add your planning poker estimate with ZenHub @louisaturn @matheusfebarbosa

rennancl commented 2 years ago

Olá @louisaturn e @matheusfebarbosa, dei 2 pontos para essa issue, pois acredito que ela é mais simples. Já temos soluções equivalentes em outras partes do sistema e alteraríamos um trecho que código executado após a execução das requisições, o que facilitaria de testar a solução, por isso, 2 pontos.