edelegationen / vlwebb-2011

Vägledningen för webbutveckling 2011
4 stars 0 forks source link

R48 bevara databas eller resultat av crawler? #52

Closed edelegationen closed 12 years ago

edelegationen commented 13 years ago

"De flesta statliga myndigheter och kommuner har idag dynamiska, databasdrivna webbplatser och därför bör utgångspunkten vara att webbplatser som utgörs av databaser ska bevaras enligt de krav som finns i RA-FS 2009:1 rörande databaser och register och att det ska finnas korrekt dokumentation upprättad (över t.ex. samband med andra system samt andra enstaka handlingar som inte bevaras i databas) enligt 5 kap. RA-FS 2009:1.

De flesta webbplatser som är databasdrivna innehåller en ändringslogg/hantering där tidigare uppgifter finns registrerade med uppgifter om tidigare "tillhörighet". Statisk insamling av "ögonblicksbilder" med hjälp av t.ex. en webbcrawler bör ses som en del av dokumentationen och inte ses som det primära bevarandet."

edelegationen commented 13 years ago

Vidare: När det gäller tanken att sådant som inte fångas upp vid insamling med t.ex. webbcrawler istället ska "samlas in på annat sätt" tycker jag är diffust formulerat. Risken är att detta innebär merarbete för myndigheterna genom att de måste hantera denna insamling med en massa manuella rutiner istället. Risken är att detta är något som görs en gång, sen struntar de i det då det är för tidskrävande. Denna typ av insamling lär enligt min mening inte underlätta ett framtida tillhandahållande av webbplatser.

TStahle commented 13 years ago

Vi har diskuterat dessa synpunkter inom Riksarkivet och kommit fram till att de metoder som föreslås i riktlinjen i nuläget trots allt bör vara de lämpligaste och mest praktiska lösningarna, dvs att kombinera 1) insamling med webbcrawler med 2) insamling genom att spara ner en statisk avbild redan vid publicering/ändring av en sida, för att på så sätt fånga upp information som hinner avpubliceras mellan crawlingstillfällena. På så sätt fångar man både bilder av hur webbplatsen har sett ut vid ett tillfälle samt tar vara på de ändringar som görs mellan crawlingarna. Både det visuella och det textbaserade innehållet bevaras.

Enligt erfarenheter inom RA skulle det vara mycket svårt att rent praktiskt bevara en webbplats som databasuttag, såsom föreslås i synpunkten. Vid ett sådant bevarande skulle bl.a. användbarheten och utlämnandet försvåras.

Att avställa/samla in webbsidor i samband med att de publiceras (nummer 2 ovan) bör kunna ske automatiskt. Sidorna kan vid detta tillfälle även indexeras och få den metadata som behövs. Det behöver med andra ord inte vara tidsödande eller komplicerat att göra denna typ av insamling. Innan en sådan lösning implementeras måste givetvis gallringsfrågorna vara utredda så att myndigheten har tagit ställning till vilken information som ska bevaras.

I nuläget ser vi alltså svårigheter med att samla in webbplatsinnehållet genom att göra databasuttag i bevarandeformat för databaser enligt RA-FS 2009:2, 3 kap 1 §. Därför har inte denna typ av insamlingsmetod tagits med i riktlinjen. (Däremot ska fristående databaser och register som läggs ut på webbplatsen samlas in på det sättet. Det framgår också av riktlinjen.)

Jag har förtydligat riktlinjen och gjort vissa språkliga ändringar men innehållet är detsamma som tidigare (2011-07-09).

haavik commented 13 years ago

Inga fler åtgärder från gruppen.

TStahle commented 13 years ago

Jag är tjänstledig t.o.m. 31 december 2011 och hänvisar vidare till riksarkivet@riksarkivet.se eller växeln tel 010-476 70 00.

Vänliga hälsningar Teresia Ståhle