clarat-org / clarat

An Open Source Charity Directory
http://www.clarat.org/
MIT License
8 stars 10 forks source link

Crawling Fehler #1470

Open Twiek opened 6 years ago

Twiek commented 6 years ago

404 auf vor allem französischen Seiten:https://www.google.com/webmasters/tools/crawl-errors?siteUrl=http://www.clarat.org/&utm_source=wnc_655201&utm_medium=gamma&utm_campaign=wnc_655201&utm_content=msg_717100&hl=de&pli=1#t2=1

NilsVollmer commented 6 years ago

Ich habe mir die Fehler mal angeschaut: fast alle Fehler sind alte Routen und kommen per 'verlinkt über' angeblich aus unserer Sitemap aber in der aktuellen Sitemap ist schon alles aktualisiert.

Entweder arbeitet Google da mit einer alten Version der Sitemap oder es werden (versteckt) durch irgendwelche Funktionen durch den Crawler Links erzeugt, denen er folgt, die aber nicht in der sitemap stehen. Siehe https://support.google.com/webmasters/answer/35120?hl=de unten unter 'häufige URL Fehler':

Wenn die URL unbekannt ist: Gelegentlich können 404-Fehler für URLs ausgegeben werden, die es auf Ihrer Website nie gegeben hat. Diese unerwarteten URLs können eventuell vom Googlebot generiert werden, wenn er versucht, Links zu folgen, die er in JavaScript, Flash-Dateien oder anderen eingebetteten Inhalten gefunden hat oder die nur in einer Sitemap vorkommen. Beispielsweise können Sie auf Ihrer Website Code wie den folgenden verwenden, um Dateidownloads in Google Analytics zu verfolgen:

\<a href="helloworld.pdf" onClick="_gaq.push(['_trackPageview','/download-helloworld']);"> Hello World PDF\

Hier könnte der Googlebot versuchen, die URL http://www.ihrebeispielurl.de/download-helloworld zu crawlen, obwohl es sich nicht wirklich um eine Seite handelt. In diesem Fall kann der Link im Bericht "Crawling-Fehler" als 404-Fehler (Nicht gefunden) angezeigt werden. Google arbeitet daran, solche Crawling-Fehler zu vermeiden. Dieser Fehler hat keinen Einfluss auf das Crawling oder Ranking Ihrer Website.

Soll ich in der Richtung weitersuchen, oder ist das von der Prio nicht so hoch, @Twiek ?