WebarchivCZ / Seeder

Seeder - Czech webarchive curating tool and public site
MIT License
15 stars 2 forks source link

Nefungují přesměrování z www do waybacku #658

Closed dragounv closed 4 months ago

dragounv commented 1 year ago

Občas po rozkliknutí odkazu na stránkách webarchivu, který směřuje na archivní verzi stránky, hlásí wayback že požadovanou stránku nemáme i přesto že archivována byla. Děje se to asi jen uvnitř sítě nkp.

Např. V kolekci lgbtq+ hned první okaz na prague pride. (odkaz na kolekci: https://www.webarchiv.cz/cs/tematicke-kolekce/lgbtq) Při rozkliknutí odkazu: https://wayback.webarchiv.cz/wayback/*/https://www.praguepride.cz/cs/ dojde pravděpodobně vynou prohlížeče k přesměrování na: https://wayback.webarchiv.cz/secure/*/https:/www.praguepride.cz/cs/ což wayback nezvládne zpracovat. ( chybí lomítko v protokolu url adresy archivní stránky )

Něco podobného se děje také při použití vyhledávání na domovské stránce webarchivu, pokud je zadána url adresa i s protokolem.

Řešení by bylo, kdyby při vytváření odkazu v kolekcích a při vyhledávání seeder kompletně odebral protokol z url archivní stránky. Tedy z: https://wayback.webarchiv.cz/wayback/*/https://www.praguepride.cz/cs/ by udělal: https://wayback.webarchiv.cz/wayback/*/www.praguepride.cz/cs/ což je adresa se kterou už by wayback neměl mít problém.

Není to tak závažný problém takže to tak nechvátá, stačí to řešit až budou vyřešené ostatní problémy.