lucasmation / osm_cnefe_import

Scripts to prepare CNEFE data, on street names and addresses in Brasil, to be imported/integrated into Opeen Street Map
8 stars 3 forks source link

Encoding #6

Open palmaresk8 opened 8 years ago

palmaresk8 commented 8 years ago

O próprio PostgreSQL traduz diferentes codificações no comando \COPY. Mesmo que o banco esteja em UTF-8, você pode usar a opção ENCODING, como abaixo:

COPY PUBLIC.TB_DOMICILIO FROM 'CNT.ICO.RJ.BHA1.ICOD884A.D100802' DELIMITERS ';' NULL '' CSV QUOTE '"' ENCODING 'WIN1252 HEADER';

O padrão do Windows (e da maior parte dos arquivos do IBGE) é o WIN1252 (ou CP1252 em outros softwares), e não o ISO-8859-1, que é um formato mais usado em páginas web. O fato é que você precisa saber (ou descobrir) a codificação do seu arquivo antes de importar, senão erros irão ocorrer (algumas sequências de bytes de uma codificação não existem em outras).

Me refiro aos erros de codificação descritos aqui