Closed ppKrauss closed 1 year ago
Problema no makefile: Pasta preserv/src comando make redirects_update
mkdir -p /tmp/pg_io -- Atualiza redirecionamentos -- Download da tabela de-para .... wget "https://docs.google.com/spreadsheets/d/1CL6f0I9DSpqKxKC7QNJGCfyabq7mDOVab5QBGV5VLOk/gviz/tq?tqx=out:csv&sheet={de-para}" -O "/tmp/pg_io/de-para.csv" --2021-12-29 18:14:22-- https://docs.google.com/spreadsheets/d/1CL6f0I9DSpqKxKC7QNJGCfyabq7mDOVab5QBGV5VLOk/gviz/tq?tqx=out:csv&sheet=%7Bde-para%7D Resolving docs.google.com (docs.google.com)... 2607:f8b0:4005:810::200e, 142.250.191.78 Connecting to docs.google.com (docs.google.com)|2607:f8b0:4005:810::200e|:443... connected. HTTP request sent, awaiting response... 200 OK Length: unspecified [text/csv] Saving to: ‘/tmp/pg_io/de-para.csv’
/tmp/pg_io/de-para.csv [ <=> ] 4,07K --.-KB/s in 0s
2021-12-29 18:14:23 (29,7 MB/s) - ‘/tmp/pg_io/de-para.csv’ saved [4172]
psql postgres://postgres@localhost/dl99t_main -c "DELETE FROM download.redirects; COPY download.redirects FROM '/tmp/pg_io/de-para.csv' CSV HEADER;" ERROR: relation "download.redirects" does not exist LINE 1: DELETE FROM download.redirects; COPY download.redirects FROM... ^ make: *** [makefile:217: redirects_update] Error 1
O problema relatado foi ocasionado pelo uso da base _dl99tmain.
A tabela redirects
está no schema download
e na base _dl02smain (até ontem estava na dl03t_main).
Para atualizar a tabela informar a base:
make redirects_update pg_db=dl02s_main
Importante notar que para a atualização da redirects
funcionar, a folha csv de de-para não deve possuir repetições na coluna de_sha256
.
Issue relacionada: https://github.com/AddressForAll/WS/issues/28.
@crebollobr por favor acrescentar mais dados na planilha de-para
Feito com os arquivos de download tem um backup em /var/www/preserv.addressforall.org/download-backup-20220527.tar
Esse backup vai ficar uma semana para teste de migração, depois apago
Feito com os arquivos de download tem um backup em /var/www/preserv.addressforall.org/download-backup-20220527.tar
Deletei o arquivo para liberar espaço no servidor. Antes, fiz o download dele para minha máquina.
se precisarem mais serviços neste assunto, por favor. abrir outra issue
O limiar de cache ficou estabelecido em ~10Gb, mas já estamos em
du -sh /var/www/preserv.addressforall.org/
= 14G. Os arquivos ofensores podem ser listados pore atualmente são:
@crebollobr favor passar os ofensores listados para o modo redirecionado.
Quanto ao
COLOMBIA_pg_dump_2021-08-16.sql.gz
, não devia estar no cache de downloads, apenas arquivos com SHA256 já registrado emmake_conf.yalm
deveriam comparecer. Foi removido.Arquivos em formato não-comprimido, tais como
079c4057762797ae4e046e330e1053e1dcf3cbb411c617772be44049764b60f0.geojson
não deveriam estar resgitrados na preservação digital. Sugere-se investigar o YAML que gerou.csv
e.json
. Em particular0c8e193ecd1647309ee8da292e217a7ce2002cb9b1815a13e2b9ddd942999e32.csv
é um arquivo vazio. Tem também os arquivos inválidos.dwg
,.zip
e.rar
a serem removidos (no futuro criar proteção contra esses lixos).