Tausende Crawlingfehler wegen Pagespeed-Modul und high-res Thumbnails

Hallo zusammen,

wir sind vor kurzem zu Timme-Hosting gewechselt und haben in unserem Hosting-Paket das Pagespeed-Modul aktiviert. Seitdem erhalten wir von Ryte (Ehemals Onpage.org) über 16.000 Crawling Fehler.

Mittlerweile haben wir herausgefunden, dass es sich um folgendes Problem handelt. In den Bildnamen der Hochauflösenden Thumbnails ist folgendes enthalten …@2x.jpg und das “@” hat den Hexadezimalen ASCII-Code 40, das wird vom Pagespeed-Modul umgewandelt in 402x.jpg was wiederum dafür sorgt, dass der Crawler einen 404 erhält.

Deaktiviere ich Pagespeed, tritt das Problem nicht mehr auf.

Hat jemand dasselbe, oder vielleicht einen Lösungsvorschlag für mich?

Hm, das scheint ein Bug auf Seiten von Ryte zu sein - deren Crawler scheint nicht mit den von PageSpeed generierten Dateinamen klarzukommen. Evtl. solltest Du deren Support einmal kontaktieren. Sorgen machen würde ich mir aber erst, wenn auch die Webmaster-Tools von Google diese Crawling-Fehler aufzeigen; tun sie das nicht, bedeutet das, daß der Google-Bot mit den Dateinamen klarkommt (wovon ich ausgehe, weil wir von diesem Problem bisher noch nichts gehört haben und das PageSpeed-Modul ja auch von Google entwickelt wird).

Timme Hosting - schnelles nginx-Hosting

www.timmehosting.de

Du solltest Pagespeed nicht zu oft deaktivieren und wieder aktivieren.
Gleiches Bild bekommt dann nämlich einen neuen Dateinamen.
Vorher gecrawlte Bilder laufen ins Leere beim erneuten Crawlen.

1 Like

@simplybecause schrieb:

Du solltest Pagespeed nicht zu oft deaktivieren und wieder aktivieren.
Gleiches Bild bekommt dann nämlich einen neuen Dateinamen.
Vorher gecrawlte Bilder laufen ins Leere beim erneuten Crawlen.

Gut zu wissen, danke! 

Gerne.

Von Ryte habe ich nun folgende Rückmeldung erhalten:

Hier musste ich auch erstmal verschiedene Meinungen einholen.
Grundsätzlich stimme ich Deinem Hoster zu, sofern der Google Crawler Dir hier keine kritischen Fehler ausgibt, solltest Du keine größeren Bedenken haben. Eine genaue Einschätzung wie sich Google hier jedoch momentan verhält und auch in der Zukunft, kann ich Dir nicht geben.

Unser Ansatz ist jedoch wirklich allen möglichen Fehlerquellen entgegenzuwirken. Öffne ich also den Quellcode der verweisenden Urls und suche nach der 404 Seite, kann sich dieser Link sehr leicht auffinden und auch öffnen lassen.

Öffne ich diesen Link der sich innerhalb eures Quellcodes befindet, werde ich auf eine 404 Seite weitergeleitet. Demnach können wir hier nicht von einem Bug ausgehen, da selbst bei manueller Prüfung sich eine 404 Seite reproduzieren lässt. Weshalb hier der Google Crawler Toleranz zeigt können wir nicht einschätzen. 

Es ist tatsächlich so, dass der Link im Quelltext einfach falsch ist, daher auch der Crawlingfehler von Ryte. Der Crawler ruft nur die Daten ab, die auch vorhanden sind. Diese werden vermutlich durch Pagespeed falsch in den Quellcode geschrieben. 

Die Frage ist nun, ist Pagespeed schuld, weil die Bildnamen umgewandelt werden, oder ist Shopware schuld, weil ein “@” im Thumbnail Namen verwendet wird?

Von Shopware erhalte ich zum Thema Pagespeed keinen Support.

Und wie sieht es aus inzwichen die Fehler werden immer noch so ausgegeben.

 

Liegt der Fehler hier bei Timmehostin?

Gibt es shopware shops  auf Timme die Pagespeed aktiv nutzen?

Was sagt denn Timme dazu ?

 

 

@TimmeHosting schrieb:

Hm, das scheint ein Bug auf Seiten von Ryte zu sein - deren Crawler scheint nicht mit den von PageSpeed generierten Dateinamen klarzukommen. Evtl. solltest Du deren Support einmal kontaktieren. Sorgen machen würde ich mir aber erst, wenn auch die Webmaster-Tools von Google diese Crawling-Fehler aufzeigen; tun sie das nicht, bedeutet das, daß der Google-Bot mit den Dateinamen klarkommt (wovon ich ausgehe, weil wir von diesem Problem bisher noch nichts gehört haben und das PageSpeed-Modul ja auch von Google entwickelt wird).

image

Timme Hosting - schnelles nginx-Hosting

www.timmehosting.de