WebarchivCZ / extinct-websites

Aplikace slouží jako automatizované řešení pro identifikaci a popis mrtvých webů. Následně je ukládá do vlastní databáze a zpřístupňuje kurátorům, kteří s informacemi v ní dále nakládají, interpretují je a obsah klasifikují.
2 stars 0 forks source link

WebBeat - lomítko na konci semínka #5

Open mariehaskovcova opened 11 months ago

mariehaskovcova commented 11 months ago

https://homel.vsb.cz/~s1a64/cd/ - chybí koncové lomítko, přestože v aplikace je semínko s lomítkem, Webeat zřejmě lomítko odstranil? Výsledkem je, že chybí page data

JanMeritus commented 10 months ago

@mariehaskovcova

 -- Metadata extraction 200 -1 ISO-8859-1
 -- Extraction data [{'title': 'Matematická analýza', 'h1_titles': ['Interaktivnístudium', 'Verze pro tisk'], 'h2_titles': ['Instalace', 'Interaktivní studium', 'Verze pro tisk', 'Externí odkazy'], 'met_description': ['None'], 'met_keywords': {'keys': [], 'str': ['None']}, 'met_author': {'mails': [], 'names': [], 'str': ['None']}}]